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腹 呈 


Java 是 目前 用 户 最 多 、 使 用 范围 最 广 的 软件 开发 技术 之 一 。Java 
的 技术 体系 主要 由 支撑 Java 程 序 运行 的 虚拟 机 、 提 供 各 开发 领域 接口 
文 持 的 Java API、Java 编 程 语言 及 许多 第 三 方 Java 框 架 (如 Spring、 
Struts 等 ) 构成 。 在 国内 ， 有 关 Java API、Java 语 言语 法 及 第 三 方 框架 
的 技术 资料 和 书籍 非常 丰富 ， 相 比 之 下 ， 有 关 Java 虚 拟 机 的 资料 却 显 


得 异 滑 贫乏 。 


这 种 状况 在 很 大 程度 上 是 由 Java 开 发 技术 本 身 的 一 个 重要 优点 导 
致 的 : 在 虚拟 机 层面 隐藏 了 底层 技术 的 复杂 性 以 及 机 噩 与 操作 系统 的 
荆 异 性 。 运 行程 序 的 物理 机 右 的 情况 千差万别 ， 而 Java 虚 拟 机 则 在 千 
莽 万 别 的 物理 机 上 建立 了 统一 的 运行 平台 ， 实 现 了 在 任意 一 台 虚 拟 机 
上 编译 的 程序 都 能 在 任何 一 台 虚 拟 机 上 正常 运行 。 这 一 极 大 优势 使 得 
Java 应 用 的 开发 比 传统 C/C++ 应 用 的 开发 更 高 效 和 快捷 ， 程 序 员 可 以 把 
主要 精力 集中 在 具体 业务 逻辑 上 ， 而 不 古物 理 硬 件 的 兼容 性 上 。 在 一 
般 情 况 下 ， 一 个 程序 员 只 要 了 解 了 必要 的 Java API、Java 语 法 ， 以 及 学 
习 适 当 的 第 三 方 开 发 框架 ， 就 已 经 基本 能 满足 日 常 开发 的 需要 了 ， 虚 
拟 机 会 在 用 户 不 知 不 觉 中 完成 对 硬件 平台 的 兼容 及 对 内 存 等 资源 的 管 
理工 作 。 因 此 ， 了 解 虚拟 机 的 运作 并 不 是 一 般 开 发 人 员 必 须 掌 握 的 知 


识 。 


然而 ， 凡 事 都 具备 两 面 性 。 随 着 Java 技 术 的 不 断 发 展 ， 它 被 应 用 
于 越 来 越 多 的 领域 之 中 。 其 中 一 些 领域 ,如 电力 、 金 融 、 通 信 等 ， 对 
程序 的 性 能 、 稳 定性 和 可 扩展 性 方面 都 有 极 高 的 要 求 。 程 序 很 可 能 在 
10 个 人 同时 使 用 时 完全 正常 ， 但 是 在 10000 个 人 同时 使 用 时 就 会 绥 慢 、 
死 山 ， 甚 至 月 涡 。 军 无 疑问 ， 要 满足 10000 个 人 同时 使 用 需要 更 高 性 能 
的 物理 人 硬件， 但 是 在 绝 大 多 数 情况 下 ， 提 升 硬件 效能 无 法 等 比例 地 捍 
升 程序 的 运作 性 能 和 并 发 能 力 ， 甚 至 可 能 对 程序 运作 状况 完全 没有 任 
何 改善 。 这 里 面 有 Java 虚 拟 机 的 原因 : 为 了 达到 给 所 有 硬件 提供 一 至 
的 虚拟 平台 的 目的 ， 牺 牲 了 一 些 与 硬件 相关 的 性 能 特性 。 更 重要 的 是 
人 为 原因 : 如 宁 开 发 人 员 不 了 解 虚拟 机 一 些 技术 特 性 的 运行 原理 ， 丈 
无 法 写 出 最 适合 虚拟 机 运行 和 目 优 化 的 代码 。 


其 实 ， 目 前 商用 的 高 性 能 Java 虚 拟 机 都 提供 了 相当 多 的 优化 特性 
和 调节 手段 ， 用 于 满足 应 用 程序 在 实际 生产 环境 中 对 性 能 和 稳定 性 的 
要 求 。 如 果 只 是 为 了 入 门 学 习 ， 让 程序 在 自己 的 机 器 上 正常 运行 ， 那 
么 这 些 特性 可 以 说 是 可 有 可 无 的 ， 如 采用 于 生产 开发 ， 尤 其 是 企业 级 
生产 开发 ， 豆 迫切 需要 开发 人 员 中 至 少 有 一 部 分 人 对 虚拟 机 的 特性 及 
调节 方法 具有 很 清晰 的 认识 ， 所 以 在 Java 开 发 体系 中 ， 对 架构 师 、 系 
统 调 优 师 、 高 级 程序 员 等 角色 的 需求 一 直 都 非常 大 。 学 习 虚 拟 机 中 各 
种 自动 运作 特性 的 原理 也 成 为 了 Java 程 序 员 成 长 道路 上 必然 会 接触 到 
的 一 读 。 本 书 可 以 使 读者 以 一 种 相对 轻松 的 方式 学 习 虚 拟 机 的 运作 诛 
理 ， 对 Java 程 序 员 的 成 长 也 有 较 大 的 帮助 。 


第 2 版 与 第 1 版 的 区 别 


JDK 1.7 在 2011 年 7 月 28 日 正式 发 布 ， 相 对 于 2006 年 发 布 的 JDK 
1.6， 新 版 的 JDK 有 了 许多 新 的 特性 和 改进 。 本 书 的 第 2 版 也 相应 地 进 
行 了 修改 和 升级 ， 把 讲解 的 技术 平台 从 JDK 1.6 提 升 至 JDK 1.7。 例 
如 ， 增 加 了 对 JDK 1.7 中 最 新 的 G1 收集 器 ， 以 及 JDK 1.7 中 JSR-292 
InvokeDynamic (对 非 Java 语 言 的 调用 支持 ) 的 分 析 讲 解 等 内 容 。 


在 第 1 版 出 版 后 ， 笔 者 收 到 了 许多 热心 读者 的 反馈 意见 ， 部 分 读者 
提出 OpenJDK 开 源 已 久 ， 第 1 版 却 很 少 有 直接 分 析 OpenJDK 源 码 的 内 
容 ， 有 点 “ 视 宝 山 而 不 见 ” 的 感觉 。 因 此 ， 在 本 书 第 2 版 中 ， 笔 者 特别 加 
强 了 对 这 部 分 内 容 的 讲解 ， 其 中 在 第 1 章 中 就 介绍 了 如 何 分 析 、 调 试 
OpenJDK 源 码 等 。 在 本 书后 续 章 节 中 ， 不 少 关 于 功能 点 的 讲解 都 直接 
使 用 OpenJDK 中 的 HotSpot 源 码 或 者 JIT 编 译 器 生成 的 本 地 代码 作为 论 
据 。 


如 何 把 Java 虚 拟 机 原理 中 许多 理论 性 很 强 的 知识 、 特 性 应 用 于 实 
践 开 发 ， 是 本 书 贯穿 始终 的 主旨。 由 于 笔者 希望 在 本 书 第 2 版 中 进一步 
加 强 知 识 的 实践 性 ， 因 此 增加 了 许多 对 处 理 JVM 第 见 问 题 技 能 的 讲 
解 ， 包 括 如 何 分 析 GC 日 志 、 如 何 分 析 JIT 编 译 右 代码 优化 过 程 和 生成 
代码 等 。 并 且 ， 在 第 1 版 的 基础 上 ， 第 2 版 中 进一步 增加 了 才干 处 理 
JVM 问 题 的 实践 案例 供 读者 参考 。 


另外 ， 本 书 第 2 版 还 修正 了 第 1 版 中 多 处 错误 的 、 有 歧义 的 和 不 完 
整 的 描述 。 有 关 勘 误 信 息 ， 可 以 参考 第 1 版 的 勘误 页 面 
(http://icyfenix.iteye.com/blog/1119214) 


本 书面 癌 的 谈 着 
(1) 使 用 Java 技 术 体系 的 中 、 高 级 开发 人 员 


Java 虚 拟 机 作为 中 、 融 级 开发 人 员 必 须 修炼 的 知识 ， 有 着 较 高 的 
学 习 门 槛 ， 本 书 可 作为 学 习 虚 拟 机 的 优秀 教材 。 


(2) 系统 调 优 师 


系统 调 优 师 古 近 几 年 才 兴 起 的 职业 ， 本 书 中 的 大 量 案例 、 代 码 和 
调 优 实战 将 会 对 系统 调 优 师 的 日 单 工作 有 直接 的 帮助 。 


(3) 系统 架构 师 


保障 系统 的 性 能 、 并 发 和 伸缩 等 能 力 是 系统 以 构 师 的 主要 职责 之 
一 ， 而 这 部 分 与 虚拟 机 的 运作 密 不 可 分 ， 本 书 可 以 作为 他 们 制定 应 用 
系统 底层 框 染 的 参考 资料 。 


如 何 阅 谈 本 书 


本 书 一 共 分 为 五 个 部 分 : 走 近 Java、 自 动 内 存 管理 机 制 、 虚 拟 机 
执行 子 系统 、 程 序 编译 与 代码 优化 、 高 效 并 发 。 各 部 分 基本 上 十 互 相 
独立 的 ， 没 有 必然 的 前 后 依赖 关系， 读者 可 以 从 任何 一 个 感 兴趣 的 专 
题 开 始 阅读 ， 但 是 每 个 部 分 中 的 各 个 章节 间 有 先后 顺序 。 


本 书 并 没有 假设 读者 在 Java 领 域 具备 很 专业 的 技术 水 平 ， 因 此 在 
保证 逻辑 准确 的 前 提 下 ， 尽 量 用 通俗 的 语言 和 案例 讲述 虚拟 机 中 与 开 
发 的 关系 最 为 密切 的 内 容 。 当 然 ， 学 习 虚 拟 机 技术 本 身 就 需要 读者 有 
一 定 的 基础 ， 且 本 书 的 读者 定位 是 中 、 高 级 程序 员 ， 因 此 本 书 假设 读 
者 目 己 了 解 一 些 常 用 的 开发 框架 、Java API 和 Java 语 法 等 基础 知识 。 


笔者 布 望 读者 在 疯 读 本 书 的 同时 ， 把 本 书 中 的 实践 内 容 亲 上 自 验 证 
一 届 ， 其 中 用 到 的 代码 清单 可 以 从 华章 网 站 
(http://www.hzbook.com) 下 载 。 


语言 约定 


本 书 在 语言 和 技术 上 有 如 下 约定 : 


本 书 中 提 到 HotSpot、JRockit 虚 拟 机 、WebLogic 服 务 器 等 产品 的 所 
有 者 时 ， 仍 然 使 用 Sun 和 BEA 公 司 的 名 称 ， 实 际 上 ，BEA 和 Sun 分 别 于 
2008 年 和 2009 年 被 Oracle 公 司 收 购 ， 现 在 已 经 不 存在 这 两 个 商标 了 ， 
但 毫 无 疑问 的 是 ， 它 们 都 是 在 Java 领 域 中 做 出 过 卓越 贡献 的 、 值 得 程 
序 员 纪念 的 公司 。 


JDK 从 1.5 版 本 开始 ， 在 官方 的 正式 文档 与 宣传 资料 中 已 经 不 再 使 
用 类 似 "JDK 1.5" 的 名 称 ， 只 有 程序 员 内 部 使 用 的 开发 版 本 号 
(Developer Version ， 例 如 java-version 的 输出 ) 才 继 续 沿用 1.5、1.6 和 
1.7 的 版 本 号 ， 而 公开 版 本 号 (Product Version) 则 改 为 JDK 5、JDK 6 
和 JDK 7 的 命名 方式 ， 为 了 行文 一 致 ， 本 书 所 有 场合 统一 采用 开发 版 
本 号 的 命名 方式 。 


由 于 版 面 关系 ， 本 书 中 的 许多 示例 代码 部 没有 遵循 最 优 的 代码 编 
写 风 格 ， 如 使 用 的 流 没 有 关闭 流 等 ， 请 读者 在 阅读 时 广 意 这 一 点 。 


如 果 没 有 特殊 说 明 ， 本 书 中 所 有 讨论 都 是 以 Sun JDK 1.7 为 技术 平 
台 的 。 不 过 如 果 有 某 个 特性 在 各 个 版 本 间 的 变化 较 大 ， 一 般 都 会 说 明 
它 在 各 个 版 本 间 的 差异 。 


第 一 部 分 走 近 Java 


本 书 的 第 一 部 分 为 后 文 的 讲解 建立 了 民 好 的 基础 。 尺 管 了 解 Java 
技术 的 来 龙 去 脉 ， 以 及 编译 自己 的 OpenJDK 对 于 读者 理解 Java 虚 拟 机 
并 不 是 必需 的 ， 但 是 这 些 准 备 过 程 可 以 为 走 近 Java 技 术 和 Java 虚 拟 机 


提供 很 好 的 引导 。 第 一 部 分 上 只 有 第 1 章 : 


第 1 章 ”介绍 了 Java 技 术 体 系 的 过 去 、 现 在 和 未 来 的 一 些 发 展 趋 
势 ， 并 介绍 了 如 何 独立 地 编译 一 个 OpenJDK 7。 


第 二 部 分 “ 目 动 内 存 管 理 机 制 


因为 程序 员 把 内 存 控 制 的 权力 交 给 了 Java 虚 拟 机 ， 所 以 可 以 在 编 
码 的 时 候 至 受 目 动 内 存 管 理 的 诸多 优势 ， 不 过 也 正 古 这 个 原因 ,， 一旦 
出 现 内 存 泄漏 和 洲 出 方面 的 问题 ， 如 采 不 了 解 虚 拟 机 是 怎样 使 用 内 存 
的 ， 那 么 排查 错误 将 会 成 为 一 项 异常 艰难 的 工作 。 第 二 部 分 包括 第 


2~5 草 : 


第 2 章 ”讲解 了 虚拟 机 中 内 存 是 如 何 划分 的 ， 以 及 哪 部 分 区 域 、 什 
么 样 的 代码 和 操作 可 能 导致 内 存 淤 出 异常 ， 并 讲解 了 各 个 区 域 出 现 内 
存 涤 出 异常 的 音 见 原因 。 


第 3 章 分析 了 垃圾 收集 的 算法 和 JDK 1.7 中 提供 的 几 蒜 垃圾 收集 
如 的 特点 及 运作 原理 。 通 过 代码 实例 验证 了 Java 虚 拟 机 中 目 动 内 存 分 
配 及 回收 的 主要 规则 。 


第 4 章 ”介绍 了 随 JDK 发 布 的 6 个 命令 行 工具 与 两 个 可 视 化 的 故障 
处 理工 具 的 使 用 方法 。 


第 5 章 与 读者 分 吝 了 几 个 比较 有 代表 性 的 实际 案例 ， 还 准备 了 一 
个 所 有 开发 人 员 都 能 “亲身 实战 ”的 练习 ， 读 者 可 通过 实践 来 获得 故障 
处 理 和 调 优 的 经 验 。 


第 三 部 分 虚拟 机 执行 子 系统 


执行 子 系统 是 虚拟 机 中 必 不 可 少 的 组 成 部 分 ， 了 解 了 虚拟 机 如 何 
执行 程序 ， 才 能 写 出 更 优秀 的 代码 。 第 三 部 分 包括 第 6~9 章 : 


第 6 革 ”讲解 了 Class 文 件 结构 中 的 各 个 组 成 部 分 ， 以 及 每 个 部 分 
的 定义 、 数 据 结构 和 使 用 方法 ， 以 实战 的 方式 演示 了 Class 文 件 的 数据 
征 如 何 存储 和 访问 的 。 


第 7 章 介绍 了 类 加 载 过 程 的 “加 载 *、“ 验 证 *、“ 准 备 ”、“ 解 
析 ” 和 “初始 化 ”5 个 阶段 中 虚拟 机 分 别 执行 了 哪些 动作 ， 还 介绍 了 类 加 
载 如 的 工作 原理 及 其 对 虚拟 机 的 意义 。 


第 8 章 “分析 了 虚拟 机 在 执行 代码 时 如 何 找到 正确 的 方法 ， 如 何 执 
行 方法 内 的 字 市 码 ， 以 及 执行 代码 时 涉及 的 内 存 结构 。 


第 9 章 ” 通 过 4 个 类 加 载 及 执行 子 系统 的 和 案例， 分享 了 使 用 类 加 载 
妖 和 人 处理 字 节 码 的 一 些 值得 欣赏 和 借鉴 的 思路 ， 并 通过 一 个 实战 练习 
来 加 深 对 前 面 理论 知识 的 理解 。 


第 四 部 分 程序 编译 与 代码 优化 


Java 程 序 从 源码 编译 成 字 节 码 和 从 字 节 码 编译 成 本 地 机 器 码 的 这 
两 个 过 程 ， 合 并 起 来 其 实 就 等 同 于 一 个 传统 编译 器 所 执行 的 编译 过 
程 。 第 四 部 分 包括 第 10~11 章 : 

第 10 章 ”分析 了 Java 语 言 中 泛 型 、 主 动 装 箱 和 拆 箱 、 条 件 编译 等 


多 种 语法 糖 的 前 因 后 采 ， 并 通过 实战 演示 了 如 何 使 用 插入 式 注解 处 理 
如 来 实现 一 个 检查 程序 命名 规范 的 编译 絮 插 件 。 


第 11 章 ”讲解 了 虚拟 机 的 热点 探测 方法 、HotSpot 的 即时 编译 硕 、 
编译 触发 条 件 ， 以 及 如 何 从 虚拟 机 外 部 观察 和 分 析 JIT 编 译 的 数据 和 结 
果 ， 此 外 ， 还 讲解 了 几 种 常见 的 编译 优化 技术 。 


了 


第 五 部 分 ”高效 并 发 


Java 语 言 和 虚拟 机 提供 了 原生 的 、 完 善 的 多 线程 文 择 ， 这 使 得 它 
天 生 殉 适合 开发 多 线程 并 发 的 应 用 程序 。 不 过 我 们 不 能 期 望 系统 来 完 


成 所 有 并 发 相关 的 处 理 ， 了 解 并 发 的 内 幕 也 是 成 为 一 个 高 级 程序 员 不 
可 缺少 的 课程 。 第 五 部 分 包括 第 12~13 章 : 


第 12 革 ”讲解 了 虚拟 机 Java 内 存 模型 的 结构 及 操作 ， 以 及 原子 
性 、 可 见 性 和 有 序 性 在 Java 内 存 模 型 中 的 体现 ， 介 绍 了 先行 发 生 原则 
的 规则 及 使 用 ， 还 了 解 了 线程 在 Java 语 言 中 是 如 何 实现 的 。 


第 13 草 “介绍 了 线程 安全 涉及 的 概念 和 分 类 、 同 步 实 现 的 方式 及 
虚拟 机 的 展 层 运作 原理 ， 并 且 介绍 了 虚拟 机 实现 高 效 并 发 所 采取 的 一 
系列 锁 优化 措施 。 


本 书 名 为 “深入 理解 Java 虚 拟 机 ”， 但 要 想 深 入 理解 虚拟 机 ， 仅 攒 
一 本 书 肯定 是 远 远 不 够 的 ， 读 者 可 以 通过 以 下 信息 找到 更 多 天 于 Java 
虚拟 机 方面 的 资料 。 我 在 写作 此 书 的 时 候 ， 也 从 下 面 这 些 参 考 人 资料 中 
获得 了 很 大 的 帮助 。 


(1) 书籍 
《The Java Virtual Machine Specification,Java SE 7 Edition》(1| 


要 学 习 虚 拟 机 ， 无 论 如 何 都 必须 掌握 “Java 虚 拟 机 规范 >。 这 本 书 
的 概念 和 细节 描述 与 Sun 的 早期 虚拟 机 (Sun Classic VM) 高 度 吻 合 ， 
不 过 ， 随 着 技术 的 发 展 ， 高 性 能 虚拟 机 真正 的 细节 实现 方式 已 经 渐渐 
与 虚拟 机 规范 所 描述 的 差距 越 来 越 大 ， 如 采 只 能 选择 一 本 参考 书 来 了 
解 虚拟 机 ， 那 我 推荐 这 本 书 。 此 书 的 Java SE 7 版 在 2011 年 7 月 出 版 发 
行 ， 这 是 自 1999 年 发 布 的 《Java 虚 拟 机 规范 (第 2 版 ，》 以 来 的 第 一 次 
版 本 更 新 。 笔 者 对 Java SE 7 版 的 全 文 进行 了 翻译 ， 并 与 原 书 一 样 在 网 
上 免费 发 布 了 全 文 PDF 。 


《The Java Language Specification,Java SE 7 Edition》 


虽然 虚拟 机 并 不 是 Java 语 言 专 有 的 ， 但 是 了 解 Java 语 言 的 各 种 细 
节 规 定 对 理解 虚拟 机 的 行为 也 是 很 有 帮助 的 ， 它 与 上 一 本 《Java 虚 拟 
机 规范 》 都 是 Sun 官 方 出 品 的 书籍 ， 而 且 这 本 书 还 是 由 Java 之 父 James 
Gosling 亲 目 执笔 摊 写 的 。 这 本 书 也 与 《Java 虚拟 机 规范 》 一 样 ， 可 以 
在 官方 网 站 完全 免费 下 载 到 全 文 PDF， 但 暂时 没有 中 文 译本 ，《Java 


FS 


语言 规范 〈 第 3 版 ) 》 于 2005 年 7 月 由 机 械 工业 出 版 社 引 进出 版 。 


《Oracle JRockit The Definitive Guide》 


《Oracle JRockit 权 威 指南 》，2010 年 7 月 出 版 ， 国 内 也 没有 (可 能 
是 尚未 ) 引进 这 本 书 ， 它 是 由 JRockit 的 两 位 资深 开发 人 员 (其 中 一 位 
还 是 JRockit Mission Control 团 队 的 TeamLeader) 撰写 的 JRockit 虚 拟 机 
高 级 使 用 指南 。 虽 然 JRockit 的 用 户 量 可 能 不 如 HotSpot 多 ,但 也 是 目前 
最 流行 的 三 大 商业 虚拟 机 之 一 ， 并 且 不 同 虚 拟 机 中 的 很 多 实现 思路 都 
是 可 以 对 比 参照 的 。 这 本 书 是 了 解 现代 高 性 能 虚拟 机 很 好 的 参考 资 
料 。 


《Inside the Java 2 Virtual Machine,Second Edition》 


《深入 Java 虚 拟 机 (第 2 版 )》，2000 年 1 月 出 版 ，2003 年 由 机 械 
工业 出 版 社 出 版 其 中 文 译本 。 在 相当 长 的 时 间 里 ， 这 本 书 是 唯一 的 一 
本 关于 Java 虚 拟 机 的 中 文 图 书 。 


《Java Performance》 


《Java Performance》 是 "The Java" 系 列 〈 许 多 人 都 读 过 该 系列 中 最 
出 名 的 《Effective Java》) 图 书 中 最 新 的 一 本 ，2011 年 10 月 出 版 ， 暂 
时 没有 中 文 版 。 这 本 书 并 非 全 部 都 围绕 Java 虚 拟 机 〈 只 有 第 3、4、7 章 
直接 与 Java 虚 拟 机 相关 ) ， 而 是 从 操作 系统 到 基于 Java 的 上 层 程 序 性 
能 度量 和 调 优 的 全 面 介绍 ， 其 中 涉及 Java 虚 拟 机 的 内 容 具 备 一 定 的 深 
度 和 可 实践 性 。 


(2) 网 站 资源 


Ey 


级 语言 虚拟 机 团子: http://hllvm.group.iteye.com/ 


里 面 有 一 些 国内 关于 虚拟 机 的 讨论 ， 并 不 只 限于 JVM， 而 是 涉及 
对 所 有 的 高 级 语言 虚拟 机 (High-Level Language Virtual Machine) 的 
讨论 ， 但 该 网 站 建立 在 ITEye 上 ， 自 然 还 是 以 讨论 Java 虚 拟 机 为 主 。 圈 
主 RednaxelaFX ( 莫 枢 ) 的 博客 (http://rednaxelafx.iteye.com/) 是 另外 
一 个 非常 有 价值 的 虚拟 机 及 编译 原理 等 资料 的 分 享 园地 。 


HotSpot Internals: 


https://wikis.oracle.com/display/HotSpotInternals/Home 


一 个 关于 OpenJDK 的 Wiki 网 站 ， 许 多 文章 都 由 JDK 的 开发 团队 编 
写 ， 更 新 较 慢 ， 但 是 仍然 有 很 高 的 参考 价值 。 


The HotSpot Group: http://openjdk.java.net/groups/hotspot/ 


HotSpot 组 群 ， 包 含 虚 拟 机 开发 、 编 译 副 、 垃 圾 收集 和 运行 时 4 个 
邮件 组 ， 其 中 有 关于 HotSpot 虚 拟 机 的 最 新 讨论 。 


[1 官方 地 址 : http://docs.oracle.com/javase/specs/jvms/se7/jvms7.pdf 。 
[2] 官 方 地 址 : http://docs.oracle.comy/javase/specs/jls/se7/jls7.pdf 。 
[3] 中 文 译本 地 址 : http://icyfenix.iteye.com/blog/1256329 。 


勘误 和 文 持 


在 本 书 交 稿 的 时 候 ， 我 并 不 像 想 象 中 的 那样 兴奋 或 放松 ， 写 作 之 
时 那 种 “ 战 战 疡 世 、 如 履 薄 冰 ” 的 感觉 依然 蒙 绕 在 心头 。 在 每 一 草 、 
一 广阔 笔 之 时 ， 我 都 在 考虑 如 何 才能 把 各 个 知识 点 更 有 条 理 地 讲述 出 
来 ， 同 时 也 在 担心 会 不 会 由 于 自己 理解 有 偏差 而 误导 了 读者 。 由 于 写 
作 水 平和 写作 时 间 所 限 ， 书 中 难免 存在 不 妥 之 处 ， 所 以 特地 开通 了 一 
个 读者 邮箱 (understandingjvm@gmail.com) 与 大 家 交流 ， 大 家 如 有 任 
何 意见 或 建议 欢迎 与 我 联系 。 相 信和 写 书 与 写 程序 一 样 ， 作 品 一 定 都 是 
不 完 类 的 ， 因 为 不 完美 ， 我 们 才 有 不 断 追 求 完美 的 动力 。 


本 书 第 2 版 的 勘误 ， 将 会 在 作者 的 博客 
(http://icyfenix.iteye.com/) 中 发 布 。 欢 迎 读者 在 博客 上 留言 。 
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世界 上 并 没有 完美 的 程序 ， 但 我 们 并 不 因此 而 诅 形 ， 因 为 写 程序 
本 来 束 是 一 个 不 断奶 求 完 美的 过 程 。 


1.1 概述 


Java 不 仅仅 生 一 门 编程 语言 ， 还 是 一 个 由 一 系列 计算 机 软件 和 规范 
形成 的 技术 体系 ， 这 个 拉 术 体系 提供 了 完整 的 用 于 软件 开发 和 跨 平台 
部 署 的 文 持 环境 ， 并 广泛 应 用 于 舱 入 式 系统 、 移 动 终端 、 企 业 服 务 
器 、 大 型 机 等 各 种 场合 ， 如 图 1-1 所 示 。 时 至 今日 ，Java 技 术 体系 已 经 
吸引 了 900 多 万 软件 开发 者 ， 这 是 全 球 最 大 的 软件 开发 团队 。 使 用 Java 
的 设备 多 达 几 十 亿 台 ， 其 中 包括 11 亿 多 人 台 个 人 计算 机 、30 亿 部 移动 电 
话 及 其 他 手持 设备 、 数 量 众多 的 智能 卡 ， 以 及 大 量 机 顶 盒 、 导 航 系统 
和 其 他 设备 [1 。 


Developers 
DeVvIices 
GlassFish 
Desktops 
phones 
Televisions 


图 1-1 Java 技 术 的 广泛 应 用 


Java 能 获得 如 此 广泛 的 认可 ， 除 了 它 拥 有 一 门 结构 严谨 、 面 向 对 和 象 
的 编程 语言 之 外 ， 还 有 许多 不 可 忽视 的 优点 : 它 摆脱 了 硬件 平台 的 束 
缚 ， 实 现 了 “一 次 编写 ， 到 处 运行 ”的 理想 ; 它 提 供 了 一 个 相对 安全 的 
内 存 管 理 和 访问 机 制 ， 避 免 了 绝 大 部 分 的 内 存 泄 露 和 指针 越界 问题 ; 
它 实 现 了 热点 代码 检测 和 运行 时 编译 及 优化 ， 这 使 得 Java 应 用 能 随 着 运 
行 时间 的 增加 而 获得 更 高 的 性 能 ， 它 有 一 套 完 善 的 应 用 程序 接口 ， 还 
有 无 数 来 自 商 业 机 构 和 开源 社区 的 第 三 方 类 库 来 帮助 它 实现 各 种 各 样 
的 功能 .…...Java 所 带 来 的 这 些 好 处 使 程序 的 开发 效率 得 到 了 很 大 的 提 
升 。 作 为 一 名 Java 程 序 员 ， 在 编写 程序 时 除了 尽情 发 挥 Java 的 各 种 优势 


外 ， 还 应 该 去 了 解 和 思考 一 下 Java 技 术 体 系 中 这 些 扩 术 特 性 是 如 何 实现 
的 。 认 识 这 些 技术 运作 的 本 质 ， 是 自己 思考 “程序 这 样 写 好 不 好 ”的 基 
础 和 前 提 。 当 我 们 在 使 用 一 种 技术 时 ， 如 果 不 再 依赖 书本 和 他 人 束 能 
得 到 这 些 问题 的 答案 ， 那 才 算 上 升 到 了 “不 惑 ”* 的 境界 。 


本 书 将 与 读者 一 起 分 析 Java 拉 术 中 最 重要 的 那些 特性 的 实现 原理 。 
在 本 章 中 ， 我 们 将 重点 介绍 Java 技 术 体系 内 容 以 及 Java 的 历史 、 现 在 和 
未 来 的 发 展 趋势 。 


[1 这些 数据 是 Java 的 广告 词 ， 它们 来 源 于 : 


http://www.java.com/zh_CN/about/° 


1.2 Java 技 术 体 系 


从 广义 上 讲 ，Clojure、JRuby、Groovy 等 运行 于 Java 虚 拟 机 上 的 语 
言及 其 相关 的 程序 都 属于 Java 技 术 体 系 中 的 一 员 。 如 果 仅 从 传统 意义 上 
来 看 ，Sun 官 方 所 定义 的 Java 技 术 体系 包括 以 下 几 个 组 成 部 分 : 


Java 程 序 设 计 语 言 

各 种 硬件 平台 上 的 Java 虚 拟 机 
Class 文 件 格式 

Java API 类 库 

来 自 商 业 机 构 和 开源 社区 的 第 三 方 Java 类 库 


我 们 可 以 把 Java 程 序 设 计 语 言 、Java 虚 拟 机 、Java API 类 库 这 三 部 
分 统称 为 JDK (Java Development Kit) ，JDK 是 用 于 支持 Java 程 序 开发 
的 最 小 环境 ， 在 后 面 的 内 容 中 ， 为 了 讲解 方便 ， 有 一 些 地 方 会 以 JDK 来 
代替 整个 Java 技 术 体系 。 另 外 ， 可 以 把 Java API 类 库 中 的 Java SE API 子 
集 山 和 Java 虚 拟 机 这 两 部 分 统称 为 JRE (Java Runtime Environment) ， 
JRE 是 文 持 Java 程 序 运行 的 标准 环境 。 图 1-2 展 示 了 Java 技 术 体 系 所 包含 
的 内 容 ， 以 及 JDK 和 JRE 所 涵盖 的 范围 。 


图 1-2 Java 技 术 体 系 所 包含 的 内 容 呈 


以 上 是 根据 各 个 组 成 部 分 的 功能 来 进行 划分 的 ， 如 果 按 照 技 术 所 
服务 的 领域 来 划分 ， 或 者 说 按照 Java 技 术 关注 的 重点 业务 领域 来 划分 ， 
Java 技 术 体 系 可 以 分 为 4 个 平台 ， 分 别 为 : 

Java Card: 支持 一 些 Java 小 程序 (Applets) 运行 在 小 内 存 设备 (如 
智能 卡 ) 上 的 平台 。 


Java ME (Micro Edition) : 支持 Java 程 序 运行 在 移动 终端 ( 手 


机 、PDA) 上 的 平台 ， 对 Java API 有 所 精简 ， 并 加 入 了 针对 移动 终端 的 


文 持 ， 这 个 版 本 以 前 称 为 J2ME 。 


Java SE (Standard Edition) : 支持 面向 桌面 级 应 用 (如 Windows 下 
的 应 用 程序 ) 的 Java 平 台 ， 提 供 了 完整 的 Java 核 心 API， 这 个 版 本 以 前 
称 为 J2SE。 


Java EE (Enterprise Edition) : 支持 使 用 多 层 架 构 的 企业 应 用 (如 
ERP、CRM 应 用 ) 的 Java 平 台 ， 除 了 提供 Java SE API 外 ， 还 对 其 做 了 
大 量 的 扩充 中 并 提供 了 相关 的 部 署 支 持 ， 这 个 版 本 以 前 称 为 J2EE 。 


IJDK 17 的 ”Java SE API 苞 
http://download.oracle.com/javase/7/docs/api/ ° 

[2] 图 片 来 源 : http://download.oracle.com/javase/7/docs/。 

[3] 这 些 扩展 一 般 以 javax.* 作 为 包 名 ， 而 以 java.* 为 包 名 的 包 都 是 Java SE 
API 的 核心 包 ， 但 由 于 历史 原因 ， 一 部 分 曾经 是 扩展 包 的 API 后 来 进入 
了 核心 包 ， 因 此 核心 包 中 也 包含 了 不 少 javax.* 的 包 名 。 


1.3 Java 发展 史 


从 第 一 个 Java 版 本 诞生 到 现在 已 经 有 18 年 的 时 间 了 “。 沧 海 桑田 一 瞬 
间 ， 转 眼 18 年 过 去 了 ， 在 图 1-3 所 展示 的 时 间 线 中 ， 我 们 看 到 JDK 已 经 
发 展 到 了 1.7 版 。 在 这 18 年 里 还 诞生 了 无 数 和 Java 相 关 的 产品 、 技 术 和 
标准 。 现 在 让 我 们 走 入 时 间 隧 道 ， 从 孕育 Java 语 言 的 时 代 开 始 ， 再 来 回 
顾 一 下 Java 的 发 展 轨迹 和 历史 变迁 。 
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图 1-3 Java 技 术 发 展 的 时 间 线 


1991 年 4 月 ， 由 James Gosling 博 士 领导 的 绿色 计划 (Green 
Project) 开始 启动 ， 此 计划 的 目的 是 开发 一 种 能 够 在 各 种 消费 性 电子 产 
品 (如 机 顶 使、 冰箱 、 收 音 机 等 ; 上 运行 的 程序 架构 。 这 个 计划 的 产 
品 就 是 Java 语 言 的 前 身 : Oak (橡树 ) 。Oak 当 时 在 消费 品 市 场 上 并 不 


算 成 功 ， 但 随 看 1995 年 互联 网 测 流 的 兴起 ，Oak 迅 速 找 到 了 最 适合 目 己 
发 展 的 市 场 定 位 并 晓 变 成 为 Java 语 言 。 


1995 年 5 月 23 日 ，Oak 语 言 改 名 为 Java， 并 且 在 SunWorld 大 会 上 正 
式 发 布 Java 1.0 版 本 。Java 语 言 第 一 次 提出 了 "Write Once,Run 


Anywhere" 的 口号 。 


1996 年 1 月 23 日 ，JDK 1.0 发 布 ，Java 语 言 有 了 第 一 个 正式 版 本 的 运 
行 环境 。JDK 1.0 提 供 了 一 个 纯 解 释 执行 的 Java 虚 拟 机 实现 (Sun Classic 
VM) 。JDK 1.0 版 本 的 代表 技术 包括 : Java 虚 拟 机 、Applet、AWT 等 。 


1996 年 4 月 ，10 个 最 主要 的 操作 系统 供应 商 申 明 将 在 其 产品 中 藤 入 
Java 技 术 。 同 年 9 月 ， 已 有 大 约 8.3 万 个 网 页 应 用 了 Java 技 术 来 制作 。 在 
1996 年 5 月 底 ，Sun 公 司 于 美国 旧金山 举行 了 首届 JavaOne 大 会 ， 从 此 
JavaOne 成 为 全 世界 数 百 万 Java 语 言 开发 者 每 年 一 度 的 技术 盛会 。 


1997 年 2 月 19 日 ，Sun 公 司 发 布 了 JDK 1.1，Java 技 术 的 一 些 最 基础 
的 支撑 点 (如 JDBC 等 ) 都 是 在 JDK 1.1 版 本 中 发 布 的 ，JDK 1.1 版 的 技 
术 代 表 有 : JAR 文 件 格 式 、JDBC、JavaBeans、RMI。Java 语 法 也 有 了 
一 定 的 发 展 ， 如 内 部 类 (Inner Class) 和 反射 Reflection) 都 是 在 这 个 
时 候 出 现 的 。 


直到 1999 年 4 月 8 日 ，JDK 1.1 一 共 发 布 了 1.1.0~1.1.8 九 个 版 本 。 从 
1.1.4 之 后 ， 每 个 JDK 版 本 都 有 一 个 自己 的 名 字 (工程 代号 ) ， 分 别 为 : 


JDK 1.1.4-Sparkler (宝石 ) 、JDK 1.1.5-Pumpkin (南瓜 ) 、JDK 1.1.6- 
Abigail ( 阿 比 盖 尔 ， 女 子 名 ) 、JDK 1.1.7-Brutus ( 布 鲁 图 ， 古 罗马 政 
治 家 和 将 军 ) 和 JDK 1.1.8-Chelsea (切尔西 ， 城 市 名 ) 


1998 年 12 月 4 日 ，JDK 迎 来 了 一 个 里 程 碑 式 的 版 本 JDK 1.2， 工 程 代 
号 为 Playground 〈 竞 技 场 ) ，Sun 在 这 个 版 本 中 把 Java 技 术 体 系 拆 分 为 3 
个 方向 ， 分 别 是 面向 桌面 应 用 开发 的 J2SE (Java 2 Platform,Standard 
Edition) 、 面 向 企业 级 开发 的 J2EE (Java 2 Platform,Enterprise Edition ) 
和 面向 手机 等 移动 终端 开发 的 J2ME (Java 2 Platform,Micro Edition ) 
在 这 个 版 本 中 出 现 的 代表 性 技术 非常 多 ， 如 EJB 、Java Plug-in 、Java 
IDL、Swing 等 ， 并 且 这 个 版 本 中 Java 虚 拟 机 第 一 次 内 置 了 JIT (Just In 
Time) 编译 器 (JDK 1.2 中 曾 并 存 过 3 个 虚拟 机 ，Classic VM 、HotSpot 
VM 和 Exact VM， 其 中 Exact VM 只 在 Solaris 平 台 出 现 过 ; 后面 两 个 虚拟 
机 都 是 内 置 JIT 编 译 器 的 ， 而 之 前 版 本 所 带 的 Classic VM 只 能 以 外 挂 的 
形式 使 用 JIT 编 译 器 ) 。 在 语言 和 API 级 别 上 ，Java 添 加 了 strictfp 关 键 字 
与 现在 Java 编 码 之 中 极为 第 用 的 一 系列 Collections 集 合 类 。 在 1999 年 3 月 
和 7 月 ， 分 别 有 JDK 1.2.1 和 JDK 1.2.2 两 个 小 版 本 发 布 。 


1999 年 4 月 27 日 ，HotSpot 虚 拟 机 发 布 ，HotSpot 最 初 由 一 家 名 
为 "Longview Technologies" 的 小 公司 开发 ， 因 为 HotSpot 的 优异 表现 ， 这 
家 公司 在 1997 年 被 Sun 公 司 收 购 了 。HotSpot 虚 拟 机 发 布 时 是 作为 JDK 


1.2 的 附加 程序 提供 的 ， 后 来 它 成 为 了 JDK 1.3 及 之 后 所 有 版 本 的 Sun 
JDK 的 默认 虚拟 机 。 


2000 年 5 月 8 日 ， 工 程 代号 为 Kestrel (美洲 红 集 ) 的 JDK 1.3 发 布 ， 
JDK 1.3 相 对 于 JDK 1.2 的 改进 主要 表现 在 一 些 类 库 上 (如 数学 运算 和 新 
的 Timer API 等 ) ，JNDI 服 务 从 JDK 1.3 开 始 被 作为 一 项 平台 级 服务 提供 

(以 前 JINDI 仅 仅 是 一 项 扩展 ) ， 使 用 CORBA IIOP 来 实现 RMI 的 通信 协 
议 ， 等 等 。 这 个 版 本 还 对 Java 2D 做 了 很 多 改进 ， 提 供 了 大 量 新 的 Java 
2D API， 并 且 新 添加 了 JavaSound 类 库 。JDK 1.3 有 1 个 修正 版 本 JDK 
1.3.1， 工 程 代 号 为 Ladybird 〈 球 虫 ) ， 于 2001 年 5 月 17 日 发 布 。 


目 从 JDK 1.3 开 始 ，Sun 维 持 了 一 个 习惯 : 大约 每 隔 两 年 发 布 一 个 
JDK 的 主 版 本 ， 以 动物 命名 ， 期 间 发 布 的 各 个 修正 版 本 则 以 昆虫 作为 工 
程 名 称 。 


2002 年 2 月 13 日 ，JDK 1.4 发 布 ， 工 程 代号 为 Merlin ( 灰 背 集 ) 。 
JDK 1.4 是 Java 真 正 走向 成 熟 的 一 个 版 本 ，Compaq、Fujitsu、SAS、 
Symbian、IBM 等 著名 公司 都 有 参与 甚至 实现 自己 独立 的 JDK 1.4。 哪 怕 
是 在 十 多 年 后 的 今天 ， 仍 然 有 许多 主流 应 用 (Spring 、Hibernate 、 
Struts 等 ) 能 直接 运行 在 JDK 1.4 之 上 ， 或 者 继续 发 布 能 运行 在 JDK 1.4 
上 的 版 本 。JDK 1.4 同 样 发 布 了 很 多 新 的 技术 特性 ， 如 正则 表达 式 、 异 
常 链 、NIO、 日 志 类 、XML 解 析 器 和 XSLT 转 换 器 等 。JDK 1.4 有 两 个 后 
续 修 正版 ，2002 年 9 月 16 日 发 布 的 工程 代号 为 Grasshopper ( 昨 蜘 ) 的 


JDK 1.4.1 与 2003 年 6 月 26 日 发 布 的 工程 代号 为 Mantis 星野) 的 JDK 
1.4.2。 


2002 年 前 后 还 发 生 了 一 件 与 Java 没 有 直接 关系 ， 但 事实 上 对 Java 的 
发 展 进程 影响 很 大 的 事件 ， 那 惑 是 微软 公司 的 .NET Framework 发 布 
了 。 这 个 无 论 息 扩 术 实现 上 还 是 目标 用 户 上 痢 与 Java 有 很 多 相近 之 处 的 
技术 平台 给 Java 带 来 了 很 多 讨论 、 比 较 和 竞争 ，.NEIT 平 台 和 Java 平 台 之 
间 声 势 浩大 的 名 优 名 劣 的 论战 到 目前 为 止 痢 在 继续 。 


2004 年 9 月 30 日 ，JDK 1.511 发 布 ， 工 程 代号 Tiger (老虎 ) 。 从 JDK 

1.2 以 来 ，Java 在 语法 层面 上 的 变换 一 直 很 小 ， 而 JDK 1.5 在 Java 语 法 易 
用 性 上 做 出 了 非常 大 的 改进 。 例 如 ， 自 动 装 箱 、 泛 型 、 动 态 注解 、 枚 
举 、 可 变 长 参数 、 遍 历 循环 _ (foreach 循环) 等 语法 特性 都 是 在 JDK 1.5 
中 加 入 的 。 在 虚拟 机 和 API 层 面 上 ， 这 个 版 本 改进 了 Java 的 内 存 模型 

(Java Memory ModelJMM) 、 提 供 了 java.util.concurrent 并 发 包 等 。 男 
外 ，JDK 1.5 是 官方 声明 可 以 支持 Windows 9x 平 台 的 最 后 一 个 JDK 版 
本 o 


2006 年 12 月 11 日 ，JDK 1.6 发 布 ， 工 程 代号 Mustang (野马 ) 。 在 这 
个 版 本 中 ，Sun 终 结 了 从 JDK 1.2 开 始 已 经 有 8 年 历史 的 J2EE、J2SE、 
J2ME 的 命名 方式 ， 启 用 Java SE 6、Java EE 6、Java ME 6 的 命名 方式 。 
JDK 1.6 的 改进 包括 : 提供 动态 语言 文 持 (通过 内 置 Mozilla JavaScript 


Rhino 引 擎 实现) 、 提 供 编 译 API 和 微型 HTTP 服 务 器 API 等 。 同 时 ， 这 


个 版 本 对 Java 虚 拟 机 内 部 做 了 大 量 改 进 ， 包 括 锁 与 同步 、 垃 圾 收集 、 类 
加 载 等 方面 的 算法 都 有 相当 多 的 改动 。 


在 2006 年 11 月 13 日 的 JavaOne 大 会 上 ，Sun 公 司 宣 布 最 终 会 将 Java 开 

源 ， 并 在 随后 的 一 年 多 时 间 内 ， 陆 续 将 JDK 的 各 个 部 分 在 GPL v2 

(GNU General Public License v2) 协议 下 公开 了 源码 ， 并 建立 了 
OpenJDK 组 织 对 这 些 源码 进行 独立 管理 。 除 了 极 少量 的 产权 代码 

(Encumbered Code， 这 部 分 代码 大 多 是 Sun 本 身 也 无 权限 进行 开源 处 
理 的 ) 外 ，OpenJDK 几 乎 包括 了 Sun JDK 的 全 部 代码 ，OpenJDK 的 质量 
主管 曾经 表示 ， 在 JDK 1.7 中 ，Sun JDK 和 OpenJDK 除 了 代码 文件 头 的 
版 权 注 释 之 外 ， 代 码 基 本 上 完全 一 样 ， 所 以 OpenJDK 7 与 Sun JDK 1.7 
本 质 上 就 是 同一 套 代码 库 开发 的 产品 。 


JDK 1.6 发 布 以 后 ， 由 于 代码 复杂 性 的 增加 、JDK 开 源 、 开 发 
JavaFX、 经 济 危 机 及 Sun 收 购 案 等 原因 ，Sun 在 JDK 发 展 以 外 的 事情 上 
耗费 了 很 多 资源 ，JDK 的 更 新 没有 再 维持 两 年 发 布 一 个 主 版 本 的 发 展 速 
度 。JDK 1.6 到 目前 为 止 一 共 发 布 了 37 个 Update 版 本 ， 最 新 的 版 本 为 
Java SE 6 Update 37， 于 2012 年 10 月 16 日 发 布 。 


2009 年 2 月 19 日 ， 工 程 代号 为 Dolphin (海豚 ) 的 JDK 1.7 完 成 了 其 
第 一 个 里 程 碑 版 本 。 根 据 JDK 1.7 的 功能 规划 ， 一 共 设 置 了 10 个 里 程 
碑 。 最 后 一 个 里 程 碑 版 本 原 计划 于 2010 年 9 月 9 日 结束 ， 但 由 于 各 种 原 
因 ，JDK 1.7 最 终 无 法 按 计划 完成 。 


从 JDK 1.7 最 开始 的 功能 规划 来 看 ， 它 本 应 是 一 个 包含 许多 重要 改 
进 的 JDK 版 本 ， 其 中 的 Lambda 项 目 《Lambda 表 达 式 、 函 数 式 编程 ) 、 
Jigsaw 项 目 (虚拟 机 模块 化 支持 ) 、 动 态 语言 文 持 、GarbageFirst 收 集 
器 和 Coin 项 目 〈 语 言 细节 进化 ) 等 子 项 目 对 于 Java 业 界 都 会 产生 深远 的 
影响 。 在 JDK 1.7 开 发 期 间 ，Sun 公 司 由 于 相继 在 技术 竞争 和 商业 竞争 
中 都 陷入 泥潭 ， 公 司 的 股票 市 值 跌 至 仅 有 高 峰 时 期 的 3%， 已 无 力 推 动 
JDK 1.7 的 研发 工作 按 正 常 计 划 进 行 。 为 了 尽快 结束 JDK 1.7 长 期 “ 跳 
票 ” 的 问题 ，Oracle 公 司 收 购 Sun 公 司 后 不 久 便 宣 布 将 实行 "B 计 划 ”， 大 
幅 裁剪 了 JDK 1.7 预 定 目 标 ， 以 便 保证 JDK 1.7 的 正式 版 能 够 于 2011 年 7 
月 28 日 准时 发 布 。“B 计 划 ” 把 不 能 按时 完成 的 Lambda 项 目 、Jigsaw 项 目 
和 Coin 项 目的 部 分 改进 延迟 到 JDK 1.8 之 中 。 最 终 ，JDK 1.7 的 主要 改进 
包括 : 提供 新 的 G1 收集 侨 (G1 在 发 布 时 依然 处 于 Experimental 状 态 ， 直 
至 2012 年 4 月 的 Update 4 中 才 正 式 “ 转 正 ”) 、 加 强 对 非 Java 语 言 的 调用 文 
持 〈JSR-292， 这 项 特性 到 目前 为 止 依然 没有 完全 实现 定型 ) 、 升 级 类 
加 载 染 构 等 。 


到 目前 为 止 ，JDK 1.7 已 经 发 布 了 9 个 Update 版 本 ， 最 新 的 Java SE 7 
Update 9 于 2012 年 10 月 16 日 发 布 。 从 Java SE 7 Update 4 起 ，Oracle 开 始 
支持 Mac OS Xx 操作 系统 ， 并 在 Update 6 中 达到 完全 支持 的 程度 ， 同 
时 ， 在 Update 6 中 还 对 ARM 指 令 集 架构 提供 了 文 持 。 人 至此， 官方 提供 
的 JDK 可 以 运行 于 Windows (不 售 Windows 9x) 、Linux、Solaris 和 Mac 
OS 平台 上 ， 支 持 ARM、x86、x64 和 Sparc 指 令 集 架构 类 型 。 


2009 年 4 月 20 日 ，Oracle 公 司 宣布 正式 以 74 亿 美元 的 价格 收购 Sun 公 
司 ，Java 商 标 从 此 正式 归 Oracle 所 有 Java 语言 本 身 并 不 属于 哪 间 公司 
所 有 ， 它 由 JCP 组 织 进行 管理 ， 尽 管 JCP 主 要 是 由 Sun 公 司 或 者 说 Oracle 
公司 所 领导 的 ) 。 由 于 此 前 Oracle 公 司 已 经 收购 了 另外 一 家 大 型 的 中 间 
件 企业 BEA 公 司 ， 在 完成 对 Sun 公 司 的 收购 之 后 ，Oracle 公 司 分 别 从 
BEA 和 Sun 中 取得 了 目前 三 大 商业 虚拟 机 的 其 中 两 个 :JRockit 和 
HotSpot,Oracle 公 司 宣 布 在 未 来 1~2 年 的 时 间 内 ， 将 把 这 两 个 优秀 的 虚拟 
机 互相 取长补短 ， 最 终 合 二 为 一 2。 可 以 预见 在 不 久 的 将 来 ，Java 虚 拟 
机 技术 将 会 产生 相当 巨大 的 变化 。 


根据 Oracle 官 方 提供 的 信息 ，JDK 1.8 的 第 一 个 正式 版 本 将 于 2013 
年 9 月 发 布 ，JDK 1.8 将 会 提供 在 JDK 1.7 中 规划 过 ， 但 最 终 未 能 在 JDK 
1.7 中 发 布 的 特性 ， 即 Lambda 表 达 式 、Jigsaw (很 不 驻 ， 随 后 Oracle 公 
司 又 宣布 Jigsaw 在 JDK 1.8 中 依然 无 法 完成 ， 需 要 延至 JDK 1.9) 和 JDK 
1.7 中 未 实现 的 一 部 分 Coin 等 。 


在 2011 年 的 JavaOne 大 会 上 ，Oracle 公 司 还 提 到 了 JDK 1.9 的 长 远 规 
划 ， 项 望 未 来 的 Java 虚 拟 机 能 够 管理 数 以 GB 计 的 Java 堆 ， 能 够 更 高 效 
地 与 本 地 代码 集成 ， 并 且 令 Java 虚 拟 机 运行 时 尽 可 能 少 人 工 干 预 ， 能 够 
目 动 调 广 。 


[1]JJDK 从 1.5 版 本 开始 ， 官 方 在 正式 文档 与 宜 传 上 已 经 不 再 使 用 类 似 
JDK 1.5 的 命名 ， 只 有 在 程序 员 内 部 使 用 的 开发 版 本 号 (Developer 


Version ， 例 如 java-version 的 输出 ) 中 才 继 续 沿 用 1.5、1.6、1.7 的 版 本 
号 ， 而 公开 版 本 号 (Product Version) 则 改 为 JDK 5、JDK 6、JDK 7 的 
命名 方式 ， 本 书 为 了 行文 一 致 ， 所 有 场合 统一 采用 开发 版 本 号 的 命名 
方 起 

[2]"HotRockit" 项 目 的 ” 相 天 介 对 
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1.4 Java 虚拟 机 发 展 史 


上 一 忆 我 们 从 整个 Java 技 术 的 角度 观察 了 Java 技 术 的 发 展 ， 许 多 
Java 程 序 员 都 会 潜意识 地 把 它 与 Sun 公 司 的 HotSpot 虚 拟 机 等 同 看 待 ， 
也 许 还 有 一 些 程序 员 会 注意 到 BEA JRockit 和 IBM J9， 但 对 JVM 的 认识 
不 仅仅 具有 了 这些。 


从 1996 年 初 Sun 公 司 发 布 的 JDK 1.0 中 所 包含 的 Sun Classic VM 到 今 
天 ， 曾 经 涌现 、 潭 炎 过 许多 或 经 典 或 优秀 或 有 特色 的 虚拟 机 实现 ， 在 
这 一 节 中 ， 我 们 先 和 暂且 把 代码 与 技术 放下 ， 一 起 来 回顾 一 下 Java 虚 拟 
机 家 族 的 发 展 轨 迹 和 历史 变迁 。 


1.4.1 Sun Classic/Exact YM 


以 今天 的 视角 来 看 ，Sun Classic VM 的 技术 可 能 很 原始 ， 这 款 虚 
拟 机 的 使 命 也 早已 终结 。 但 仅 任 它 “ 世 界 上 第 一 款 商 用 Java 虚 拟 机 ”的 
头衔 ， 束 足够 有 让 历史 记 住 它 的 理由 。 


1996 年 1 月 23 日 ，Sun 公 司 发 布 JDK 1.0，Java 语 言 首次 拥有 了 商用 
的 正式 运行 环境 ， 这 个 JDK 中 所 带 的 虚拟 机 就 是 Classic VM。 这 款 虚 
拟 机 只 能 使 用 纯 解 释 器 方式 来 执行 Java 代 码 ， 如 果 要 使 用 JIT 编 译 器 ， 
就 必须 进行 外 挂 。 但 是 假如 外 挂 了 JIT 编 译 器 ，JIT 编 译 器 就 完全 接管 


了 虚拟 机 的 执行 系统 ， 解 释 器 便 不 再 工作 了 。 用 户 在 这 球 虚 拟 机 上 执 
行 java-version 命 令 ， 将 会 看 到 类 似 下 面 这 行 输出 : 


Java version"1.2.2" 
Classic VM (build JDK-1.2.2-001, green threads, sunwjit) 


其 中 的 "sunwjit" 就 是 Sun 提 供 的 外 挂 编译 器 ， 其 他 类 似 的 外 挂 编译 
器 还 有 Symantec JIT 和 shuJIT 等 。 由 于 解释 器 和 编译 器 不 能 配合 工作 ， 
这 束 意 味 厦 如 果 要 使 用 编译 器 执行 ， 编 译 硕 吏 不 得 不 对 每 一 个 方法 、 
每 一 行 代码 都 进行 编译 ， 而 无 论 它们 执行 的 频率 是 否 具 有 编译 的 价 
值 。 基 于 程序 响应 时 间 的 压力 ， 这 些 编译 器 根本 不 敢 应 用 编译 耗 时 稍 
高 的 优化 技术 ， 因 此 这 个 阶段 的 虚拟 机 即使 用 了 JIT 编 译 锅 输出 本 地 代 
码 ， 执 行 效率 也 和 传统 的 C/C++ 程序 有 很 大 差距 ，“Java 语 言 很 慢 * 的 形 
象 就 是 在 这 时 候 开 始 在 用 户 心中 树立 起 来 的 。 


Sun 的 虚拟 机 团队 努力 去 解决 Classic VM 所 面临 的 各 种 问题 ， 提 升 
运行 效率 。 在 JDK 1.2 时 ， 曾 在 Solaris 平 台 上 发 布 过 一 款 名 为 Exact VM 
的 虚拟 机 ， 它 的 执行 系统 已 经 具备 现代 高 性 能 虚拟 机 的 雏形 : 如 两 级 
即时 编译 器 、 编 译 器 与 解释 器 混合 工作 模式 等 。Exact VM 因 它 使 用 准 
确 式 内 存 管理 (Exact Memory Management， 也 可 以 叫 Non- 
Conservative/Accurate Memory Management) 而 得 名 ， 即 虚拟 机 可 以 知 
道内 存 中 某 个 位 置 的 数据 具体 是 什么 类 型 。 壁 如 内 存 中 有 一 个 32 位 的 
整数 123456， 它 到 底 是 一 个 reference 类 型 指向 123456 的 内 存 地 址 还 是 


一 个 数值 为 123456 的 整数 ， 虚 拟 机 将 有 能 力 分 辨 出 来 ， 这 样 才能 在 GC 
(垃圾 收集 ) 的 时 候 准 确 判 断 堆 上 的 数据 是 否 还 可 能 被 使 用 。 由 于 使 
用 了 准确 式 内 存 管理 ，Exact VM 可 以 抛弃 以 前 Classic VM 基于 handler 
的 对 象 查找 方式 (原因 是 进行 GC 后 对 象 将 可 能 会 被 移动 位 置 ， 如 果 将 
地 址 为 123456 的 对 象 移动 到 654321， 在 没有 明确 信息 表明 内 存 中 哪些 
数据 是 reference 的 前 提 下 ， 虚 拟 机 是 不 敢 把 内 存 中 所 有 为 123456 的 值 
改 成 654321 的 ， 所 以 要 使 用 句柄 来 保持 reference 值 的 稳定 ) ， 这 样 每 
次 定位 对 象 都 少 了 一 次 间接 查找 的 开销 ， 提 升 执行 性 能 。 


虽然 Exact VM 的 技术 相对 Classic VM 来 说 先进 了 许多 ， 但 是 在 商 
业 应 用 上 只 存在 了 很 短暂 的 时 间 就 被 更 为 优秀 的 HotSpot VM 所 取代 ， 
甚至 还 没有 来 得 及 发 布 Windows 和 Linux 平 台 下 的 商用 版 本 。 而 Classic 
VM 的 生命 周期 则 相对 长 了 许多 ， 它 在 JDK 1.2 之 前 是 Sun JDK 中 唯一 
的 虚拟 机 ， 在 JDK 1.2 时 ， 它 与 HotSpot VM 并 存 ， 但 默认 使 用 的 是 
Classic VM (用 户 可 用 java-hotspot 参 数 切 换 至 HotSpot VM) ， 而 在 
JDK 1.3 时 ，HotSpot VM 成 为 默认 虚拟 机 ， 但 Classic VM 仍 作为 虚拟 机 
的 “备用 选择 ”发布 (使 用 java-classic 参 数 切 换 ) ， 直 到 JDK 1.4 的 时 
候 ，Classic VM 才 完全 退出 商用 虚拟 机 的 历史 舞台 ， 与 Exact VM 一 起 
进入 了 Sun Labs Research VM 之 中 。 


1.4.2 Sun HotSpot VM 


提起 HotSpot VM， 相 信 所 有 Java 程 序 员 都 知道 ， 它 是 Sun JDK 和 
OpenJDK 中 所 带 的 虚拟 机 ， 也 是 目前 使 用 范围 最 广 的 Java 虚 拟 机 。 但 
不 一 定 所 有 人 都 知道 的 是 ， 这 个 目前 看 起 来 “血统 纯正 ”的 虚拟 机 在 最 
初 并 非 由 Sun 公 司 开 发 ， 而 是 由 一 家 名 为 "Longview Technologies" 的 小 
公司 设计 的 ; 甚至 这 个 虚拟 机 最 初 并 非 是 为 Java 语 言 而 开发 的 ， 它 来 
源 于 Strongtalk VM， 而 这 款 虚 拟 机 中 相当 多 的 技术 又 是 来 源 于 一 款 文 
持 Self 语 言 实 现 * 达 到 C 语 言 50% 以 上 的 执行 效率 ”的 目标 而 设计 的 虚拟 
机 ，Sun 公 司 注意 到 了 这 款 虚 拟 机 在 JIT 编 译 上 有 许多 优秀 的 理念 和 实 
际 效 果 ， 在 1997 年 收购 了 Longview Technologies 公 司 ， 从 而 获得 了 
HotSpot VM ° 


HotSpot VM 既 继 承 了 Sun 之 前 两 款 商 用 虚拟 机 的 优点 (如 前 面 提 
到 的 准确 式 内 存 管理 ) ， 也 有 许多 自己 新 的 技术 优势 ， 如 它 名称 中 的 
HotSpot 指 的 就 是 它 的 热点 代码 探测 技术 (其 实 两 个 VM 基本 上 是 同时 
期 的 独立 产品 ，HotSpot 还 稍 早 一 些 ，HotSpot 一 开始 就 是 准确 式 GC， 
而 Exact VM 之 中 也 有 与 HotSpot 儿 平一 样 的 热点 探测 。 为 了 Exact VM 
和 HotSpot VM 哪个 成 为 Sun 主 要 支持 的 VM 产品 ， 在 Sun 公 司 内 部 还 有 
过 争论 ，HotSpot 打 败 Exact 并 不 能 算 技 术 上 的 胜利 ) ，HotSpot VM 的 
热点 代码 探测 能 力 可 以 通过 执行 计数 器 找 出 最 具有 编译 价值 的 代码 ， 


然后 通知 JIT 编 译作 以 方法 为 单位 进行 编译 。 如 有 果 一 个 方法 被 频 烷 调 
用 ， 或 方法 中 有 效 循环 次 数 很 多 ， 将 会 分 别 触发 标准 编译 和 OSR ( 栈 
上 替换 ) 编译 动作 。 通 过 编译 器 与 解释 器 恰当 地 协同 工作 ， 可 以 在 最 
优化 的 程序 啊 应 时 间 与 最 佳 执 行 性 能 中 取得 平衡 ， 而 且 无 须 等 每 本 地 
代码 输出 才能 执行 程序 ， 即 时 编译 的 时 间 压 力也 相对 减 小 ， 这 样 有 助 
于 引入 更 多 的 代码 优化 技术 ， 输 出 质量 更 高 的 本 地 代码 。 


在 2006 年 的 JavaOne 大 会 上 ，Sun 公 司 宣布 最 终 会 把 Java 开 源 ， 并 
在 随后 的 一 年 ， 陆 续 将 JDK 的 各 个 部 分 (其 中 当然 也 包括 了 HotSpot 
VM) 在 GPL 协 议 下 公开 了 源码 ， 并 在 此 基础 上 建立 了 OpenJDK。 这 
样 ，HotSpot VM 便 成 为 了 Sun JDK 和 OpenJDK 两 个 实现 极度 接近 的 
JDK 项 目的 共同 虚拟 机 。 


在 2008 年 和 2009 年 ，Oracle 公 司 分 别 收购 了 BEA 公 司 和 Sun 公 司 ， 
这 样 Oracle 就 同时 拥有 了 两 款 优秀 的 Java 虚 拟 机 : JRockit VM 和 
HotSpot VM。Oracle 公 司 宣布 在 不 和 久 的 将 来 (大约 应 在 发 布 JDK 8 的 时 
候 ) 会 完成 这 两 款 虚 拟 机 的 整合 工作 ， 使 之 优势 互补 。 整 合 的 方式 大 
致 上 是 在 HotSpot 的 基础 上 ， 移 植 JRockit 的 优秀 特性 ， 璧 如 使 用 JRockit 
的 垃圾 回收 需 与 MissionControl 服 务 ， 使 用 HotSpot 的 JIT 编 译 融 与 混合 
的 运行 时 系统 。 


1.4.3 Sun Mobile-Embedded VM/Meta-Circular YM 


Sun 公 司 所 研发 的 虚拟 机 可 不 仅 有 前 面 介 绍 的 服务 厦 、 梨 面 领域 
的 商用 虚拟 机 ， 除 此 之 外 ，Sun 公 司 面 对 移 动 和 内 入 式 市 场 ， 也 发 布 
过 虚拟 机 产品 ， 男 外 还 有 一 类 虚拟 机 ， 在 设计 之 初 束 没 抱 有 商用 的 目 
的 ， 仅 仅 是 用 于 人 研究、 验证 某 种 技术 和 观点 ， 又 或 者 是 作为 一 些 规范 
的 标准 实现 。 这 些 虚 拟 机 对 于 大 部 分 不 从 事 相 关 领 域 开 发 的 Java 程 序 
员 来 说 可 能 比较 陌生 。Sun 公 司 发 布 的 其 他 Java 虚 拟 机 有 : 


(1) KVM 


KVM 中 的 K 是 "Kilobyte" 的 意思 ， 它 强调 简单 、 轻 量 、 高 度 可 移 
植 ， 但 是 运行 速度 比较 慢 。 在 Android、iOS 等 智能 手机 操作 系统 出 现 
前 曾经 在 手机 平台 上 得 到 非常 广泛 的 应 用 。 


(2) CDC/CLDC HotSpot Implementation 


CDC/CLDC 全 称 是 Connected (Limited) Device Configuration， 在 
JSR-139/JSR-218 规 范 中 进行 定义 ， 
备 上 建立 统一 


JL 


已 希望 在 手机 、 电 子 书 、PDA 等 设 
的 Java 编 程 接口 ， 而 CDC-HI VM 和 CLDC-HI YM 则 是 它 
们 的 一 组 参考 实现 。CDC/CLDC 是 整个 Java ME 的 重要 支柱 ， 但 从 目前 


Android 和 iOS 二 分 天 下 的 移动 数字 设备 市 场 看 来 ， 在 这 个 领域 中 ，Sun 
的 虚拟 机 所 面临 的 局 面 远 不 如 服务 右 和 桌面 领域 乐观 。 


(3) Squawk VM 


Squawk VM 由 Sun 公 司 开发 ， 运 行 于 Sun SPOT (Sun Small 
Programmable Object Technology， 一 种 手持 的 WiFi 设 备 ) ， 也 曾经 运 
用 于 Java Card。 这 是 一 个 Java 代 码 比 重 很 高 的 租 入 式 虚 拟 机 实现 ， 其 
中 诸如 类 加 载 器 、 字 节 码 验证 器 、 垃 圾 收集 器 、 解 释 器 、 编 译 器 和 线 
程 调度 都 是 Java 语 言 本 吴 完 成 的 ， 仅 仅 靠 C 语 言 来 编写 设备 MO 和 必要 
的 本 地 代码 。 


(4) JavaInJava 


JavaInJava 是 Sun 公 司 于 1997 年 ~1998 年 间 研发 的 一 个 实验 室 性 质 的 
虚拟 机 ， 从 名 字 就 可 以 看 出 ， 它 试图 以 Java 语 言 来 实现 Java 语 言 本 号 
的 运行 环境 ， 既 所 谓 的 “元 循环 ”(Meta-Circular， 是 指使 用 语言 自身 
来 实现 其 运行 环境 ) 。 它 必须 运行 在 另外 一 个 宿主 虚拟 机 之 上 ， 内 部 
没有 JII 编 译 器 ， 代 码 只 能 以 解释 模式 执行 。 在 20 世 纪 末 主流 Java 虚 拟 
机 都 未 能 很 好 解决 性 能 问题 的 时 代 ， 开 发 这 种 项 目 ， 其 执行 速度 可 想 
而 知 。 


(5) Maxine VM 


Maxine VM 和 上 面 的 JavaInJava 非 常 相 似 ， 它 也 是 一 个 几乎 全 部 以 
Java 代 码 实现 (只 有 用 于 启动 JVM 的 加 载 嚣 使 用 C 语 言 编 写 ) 的 元 循环 
Java 虚 拟 机 。 这 个 项 目 于 2005 年 开始 ， 到 现在 仍然 在 发 展 之 中 ， 比 起 
JavaInJava,Maxine VM 束 显 得 “ 靠 谱 ”很 多 ， 它 有 先进 的 JIT 编 译 侣 和 垃 
圾 收集 器 (但 没有 解释 器 ) ， 可 在 宿主 模式 或 独立 模式 下 执行 ， 其 执 


处 人 


行 效率 已 经 接近 了 HotSpot Client VM 的 水 平 。 


1.4.4 BEA JRockiVIBM J9 VM 


前 面 介绍 了 Sun 公 司 的 各 种 虚拟 机 ， 除 了 Sun 公 司 以 外 ， 其 他 组 
织 、 公 司 也 研发 过 不 少 虚 拟 机 实现 ， 其 中 规模 最 大 、 最 著名 的 就 是 
BEA 和 IBM 公 司 了 。 


JRockit VM 曾经 号 称 “ 世 界 上 速度 最 快 的 Java 虚 拟 机 ” (广告 词 ， 
貌似 J9 VM 也 这 样 说 过 ) ， 它 是 BEA 公 司 在 2002 年 从 Appeal Virtual 
Machines 公 司 收 购 的 虚拟 机 。BEA 公 司 将 其 发 展 为 一 款 专门 为 服务 器 
硬件 和 服务 器 端 应 用 场景 高 度 优化 的 虚拟 机 ， 由 于 专注 于 服务 器 端 应 
用 ， 它 可 以 不 太 关注 程序 启动 速度 ， 因 此 JRockit 内 部 不 包含 解析 器 实 
现 ， 全 部 代码 都 靠 即 时 编译 器 编译 后 执行 。 除 此 之 外 ，JRockit 的 垃圾 
收集 器 和 MissionControl 服 务 套件 等 部 分 的 实现 ， 在 众多 Java 虚 拟 机 中 
也 一 直人 处 于 领先 水 平 。 


IBM J9 VM 并 不 是 IBM 公 司 唯一 的 Java 虚 拟 机 ， 不 过 是 目前 其 主 
力 发 展 的 Java 虚 拟 机 。IBM J9 VM 原 本 是 内 部 开发 代号 ， 正 式 名 称 
是 "TBM Technology for Java Virtual Machine"， 简 称 IT4J， 只 是 这 个 名 
字 太 撩 口 了 一 点 ， 普 及 程度 不 如 J9。J9 VM 最 初 是 由 IBM Ottawa 实 验 
室 一 个 名 为 SmallTalk 的 虚拟 机 扩展 而 来 的 ， 当 时 这 个 虚拟 机 有 一 个 
bug 是 由 8k 值 定义 错误 引起 的 ， 工 程 师 花 了 很 长 时 间 终 于 发 现 并 解决 了 


这 个 错误 ， 此 后 这 个 版 本 的 虚拟 机 束 称 为 K8 了 ， 后 来 扩展 出 支持 Java 
的 虚拟 机 就 被 称 为 9 了。 与 BEA JRockit 专 注 于 服务 器 端 应 用 不 同 ， 


它 是 一 款 设 计 上 从 服务 大 


IBM J9 的 市 场 定位 与 Sun HotSpot 比 较 接 近 ， 
端 到 桌面 应 用 再 到 骸 入 式 都 全 面 考虑 的 多 用 途 虚 拟 机 ，J9 的 开发 目的 
是 作为 IJBM 公 司 各 种 Java 产 品 的 执行 平台 ， 它 的 主要 市 场 是 和 IBM 产 
品 〈 如 IBM WebSphere 等 ) 搭配 以 及 在 IBM AIX 和 z/OS 这 些 平 台 上 部 


署 Java 必 用。 


1.4.5 Azul VM/BEA Liquid VM 


我 们 平时 所 提 及 的 “高 性 能 Java 虚 拟 机 ”一 般 是 指 HotSpot、 
JRockit、J9 这 类 在 通用 平台 上 运行 的 商用 虚拟 机 ， 但 其 实 Azul VM 和 
BEA Liquid VM 这 类 特定 硬件 平台 专 有 的 虚拟 机 才 是 “高 性 能 ”的 武 


口 日 


五 计 2 


Azul VM 是 Azul Systems 公 司 在 HotSpot 基 础 上 进行 大 量 改进 ， 运 
行 于 Azul Systems 公 司 的 专 有 硬件 Vega 系 统 上 的 Java 虚 拟 机 ， 每 个 Azul 
VM 实例 都 可 以 管理 至 少数 十 个 CPU 和 数 百 GB 内 存 的 硬件 资源 ， 并 提 
供 在 巨大 内 存 范围 内 实现 可 控 的 GC 时 间 的 垃圾 收集 器 、 为 专 有 硬件 优 
化 的 线程 调度 等 优秀 特性 。 在 2010 年 ，Azul Systems 公 司 开始 从 硬件 转 
向 软件 ， 发 布 了 自己 的 Zing JVM， 可 以 在 通用 x86 平 台 上 提供 接近 于 
Vega 系 统 的 特性 。 


Liquid VM 即 是 现在 的 JRockit VE (Virtual Edition) ， 它 是 BEA 公 
司 开 发 的 ， 可 以 直接 运行 在 自家 Hypervisor 系 统 上 的 JRockit VM 的 虚拟 
化 版 本 ，Liquid VM 不 需要 操作 系统 的 支持 ， 或 者 说 它 自 己 本 身 实现 了 
一 个 专用 操作 系统 的 必要 功能 ， 如 文件 系统 、 网 络 支 持 等 。 由 虚拟 机 
越过 通用 操作 系统 直接 控制 硬件 可 以 获得 很 多 好 处， 如 在 线程 调度 


时 ， 不 需要 再 进行 内 核 态 /用 户 态 的 切换 等 ， 这 样 可 以 最 大 限度 地 发 挥 
硬件 的 能 力 ， 提 升 Java 程 序 的 执行 性 能 。 


1.4.6 Apache Harmony/Google Android Dalvik VM 


这 节 介 绍 的 Harmony VM 和 Dalvik VM 只 能 称 做 “虚拟 机 ”"， 而 不 能 
称 做 “Java 虚 拟 机 *， 但 是 这 两 款 虚 拟 机 (以 及 所 代表 的 技术 体系 ) 对 
最 近 几 年 的 Java 世 界 产 生 了 非常 大 的 影响 和 挑战 ， 甚 至 有 些 悲 观 的 评 
论 家 认为 成 熟 的 Java 生 态 系统 有 毅 溃 的 可 能 。 


Apache Harmony 是 一 个 Apache 软 件 基 金 会 旗下 以 Apache License 
协议 开源 的 实际 兼容 于 JDK 1.5 和 JDK 1.6 的 Java 程 序 运行 平台 ， 这 个 介 
绍 相当 逝 口 。 它 包含 自己 的 虚拟 机 和 Java 库 ， 用 户 可 以 在 上 面 运 行 
Eclipse、Tomcat、Maven 等 常见 的 Java 程 序 ， 但 是 它 没有 通过 TCK 认 
证 ， 所 以 我 们 不 得 不 用 那么 一 长 串 逝 口 的 语言 来 介绍 它 ， 而 不 能 用 一 
人 句 “Apache 的 JDK” 来 说 明 。 如 果 一 个 公司 要 宣布 自己 的 运行 平台 “兼容 
于 Java 语 言 ”， 那 就 必须 要 通过 TCK (Technology Compatibility Kit) 的 
兼容 性 测试 。Apache 基 金 会 曾 要 求 Sun 公 司 提供 TCK 的 使 用 授权 ， 但 
是 一 直 遭 到 拒绝 ， 直 到 Oracle 公 司 收购 了 Sun 公 司 之 后 ， 双 方 天 系 越 六 
越 僵 ， 最 终 导 致 Apache 丑 然 退 出 JCP (Java Community Process) 组 


织 ， 这 有 是 目前 为 止 Java 社 区 节 疡 重 的 一 次 “分 裂 ”。 


在 Sun 将 JDK 开 源 形 成 OpenJDK 之 后 ，Apache Harmony 开 源 的 优势 
被 极 大 地 削弱 ， 甚 至 连 Harmony 项 目的 最 大 参与 者 IBM 公 司 也 宣布 辞 


去 Harmony 项 目 管理 主席 的 职位 ， 并 参与 OpenJDK 项 目的 开发 。 虽 然 
Harmony 没 有 经 过 真正 大 规模 的 商业 运用 ， 但 是 它 的 许多 代码 (基本 
上 是 Java 库 部 分 的 代码 ) 被 吸纳 进 IBM 的 JDK 7 实现 及 Google Android 
SDK 之 中 ， 尤 其 是 对 Android 的 发 展 起 到 了 很 大 的 推动 作用 。 


说 到 Android， 这 个 时 下 最 热门 的 移动 数码 设备 平台 在 最 近 儿 年 间 
的 发 展 过 程 中 所 取得 的 成 采 已 经 远 远 超 越 了 Java ME 在 过 去 十 多 年 所 获 
得 的 成 果 ，Android 计 Java 语言 真正 走 进 了 移动 数码 设备 领域 ， 只 十 走 
的 并 非 Sun 公 司 原 本 想象 的 那 一 条 路 。 


Dalvik VM 是 Android 平 台 的 核心 组 成 部 分 之 一 ， 它 的 名 字 来 源 于 
冰岛 一 个 名 为 Dalvik 的 小 渔村 。Dalvik VM 并 不 是 一 个 Java 虚 拟 机 ， 它 
没有 遵循 Java 虚 拟 机 规范 ， 不 能 直接 执行 Java 的 Class 文 件 ， 使 用 的 是 
寄存 器 架构 而 不 是 JVM 中 常见 的 栈 架 构 。 但 是 它 与 Java 又 有 着 千 丝 万 
缕 的 联系 ， 它 执行 的 dex (Dalvik Executable) 文件 可 以 通过 Class 文 件 
转化 而 来 ， 使 用 Java 语 法 编写 应 用 程序 ， 可 以 直接 使 用 大 部 分 的 Java 
API 等 。 目 前 Dalvik VM 随 着 Android 一 起 处 于 迅猛 发 展 阶 段 ， 在 
Android 2.2 中 已 提供 即时 编译 器 实现 ， 在 执行 性 能 上 有 了 很 大 的 提 


二 站 
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1.4.7 ”Microsoft JVM 及 其 他 


在 十 几 年 的 Java 虚 拟 机 发 展 过 程 中 ， 除 去 上 面 介绍 的 那些 被 大 规 
模 商 业 应 用 过 的 Java 虚 拟 机 外 ， 还 有 许多 虚拟 机 是 不 为 人 知 的 或 者 曾 
经 “绚丽 ?过 但 最 终 沐 灭 的 。 我 们 以 其 中 微软 公司 的 JVM 为 例 来 介绍 一 
人 


也 许 Java 程 序 员 听 起 来 可 能 会 觉得 惊讶 ， 微 软 公 司 曾经 是 Java 技 
术 的 铁杆 文 持 者 〈 也 必须 承认 ， 与 Sun 公 司 争夺 Java 的 控制 权 ， 令 Java 
从 跨 平 台 技 术 变 为 绑 定 在 windows 上 的 技术 是 微软 公司 的 主要 目 
的 ) 。 在 Java 语 言 诞生 的 初期 (1996 年 ~1998 年 ， 以 JDK 1.2 发 布 为 分 
界 ) ， 它 的 主要 应 用 之 一 是 在 浏览 器 中 运行 Java Applets 程 序 ， 微 软 公 
司 为 了 在 IE3 中 支持 Java Applets 应 用 而 开发 了 自己 的 Java 虚 拟 机 ， 虽 然 
这 款 虚 拟 机 只 有 Windows 平 台 的 版 本 ， 却 是 当时 Windows 下 性 能 最 好 
的 Java 虚 拟 机 ， 它 在 1997 年 和 1998 年 连续 两 年 获得 了 《PC Magazine》 
杂志 的 “编辑 选择 奖 ”。 但 好 景 不 长 ， 在 1997 年 10 月 ，Sun 公 司 正 式 以 侵 
犯 商 标 、 不 正当 竞争 等 罪名 控告 微软 公司 ， 在 随后 对 微软 公司 的 垄断 
调查 之 中 ， 这 款 虚 拟 机 也 曾 作 为 证 据 之 一 被 呈送 法 庭 。 这 场 官司 的 结 
果 是 微软 公司 赔偿 2000 万 美金 给 Sun 公 司 (最 终 微 软 公 司 因 蕉 断 赔偿 
给 Sun 公 司 的 总 金额 高 达 10 亿 美元 ， 承 庄 终 止 其 Java 虚 拟 机 的 发 展 ， 
并 逐步 在 产品 中 移 除 Java 虚 拟 机 相关 功能 。 上 有 具有 讽刺 意味 的 是 ， 到 最 


后 在 Windows XP SP3 中 Java 虚 拟 机 被 完全 抹 去 的 时 候 ，Sun 公 司 却 又 到 
处 登 报 希望 微软 公司 不 要 这 样 做 iI。Windows XP 高 级 产品 经 理 Jim 
Cullinan 称 : “我 们 花费 了 3 年 的 时 间 和 Sun 打 官司 ， 当 时 他 们 试图 阻止 
我 们 在 Windows 中 支持 Java， 现 在 我 们 这 样 做 了 ， 可 他 们 又 在 抱怨 ， 
这 太 具 有 讽刺 意味 了 。” 


我 们 试想 一 下 ， 如 有 果 当 年 Sun 公 司 没 有 起 诉 微软 公司 ， 微 软 公司 
继续 保持 着 对 Java 技 术 的 热情 ， 那 Java 的 世界 会 变 得 怎么 样 呢 ? .NET 
技术 是 人 否 会 发 展 起 来 ? 但 历史 是 没有 假设 的 。 其 他 在 本 节 中 没有 介绍 
到 的 Java 虚 拟 机 还 有 (当然 ， 应 该 还 有 很 多 笔者 所 不 知道 的 ) : 


JamVM. 


CdqCdqOVInD. 


SableVM. 


Kaffe. 


Jelatine JVM. 


NanoVM. 


MRP 


Moxie JVM. 


Jikes RVM. 


[Sun 公 司 在 《纽约 时 报 》、《 圣 约 瑟 商 业 新 闻 》 和 下 《华尔街 周刊 》 
上 刊登 了 整 页 的 广告 ， 在 广告 词 中 Sun 公 司 号 召 消 费 者 “要 求 微 软 公 司 
继续 在 其 Windows XP 系统 包括 Java 平 台 ”。 


1.5 ”展望 Java 技 术 的 未 来 


在 2005 年 ，Java 语 言 诞 生 10 周 年 的 SunOne 技 术 大 会 上 ，Java 语 言 
之 父 James Gosling 做 了 一 场 题 为 "Java 技 术 下 一 个 十 年 > 的 演讲 。 笔 者 不 
具备 James Gosling 博 士 那样 高 屋 建 令 的 视角 ， 这 里 仅 从 Java 平 台中 几 
个 新 生 的 但 已 经 开始 展现 出 蓬勃 之 势 的 技术 发 展 点 来 看 一 下 后 续 1~2 
个 JDK 版 本 内 的 一 些 很 有 和 希望 的 技术 重点 。 


1.5.1 ”模块 化 


模块 化 是 解决 应 用 系统 与 扩 术 平台 越 来 越 复 杂 、 越 来 越 庞大 问题 
的 一 个 重要 途径 。 无 论 是 开发 人 员 还 是 产品 最 终 用 户 ， 都 不 硕 望 为 了 
系统 中 一 小 块 的 功能 而 不 得 不 下 载 、 安 装 、 部 署 及 维护 整套 庞大 的 系 
统 。 站 在 整个 软件 工业 化 的 高 度 来 看 ， 模 块 化 是 建立 各 种 功能 的 标准 
件 的 前 提 。 最 近 几 年 OSGi 技 术 的 迅速 发 展 、 各 个 厂商 在 JCP 中 对 模块 
化 规范 的 激烈 斗争 由， 都 能 充分 说 明 模块 化 技术 的 迫切 和 重要 。 


在 未 来 的 Java 平 台中 ， 很 可 能 会 对 模块 化 提出 语法 层面 的 支持 。 
早 在 2007 年 ，Sun 公 司 就 提出 过 JSR-277: Java 模 块 系统 (Java Module 
System) ， 试 图 建立 Java 平 台 的 模块 化 标准 ， 但 受挫 于 以 IJBM 公 司 为 
主导 提交 的 JSR-291: Java SE 动态 组 件 支 持 【Dynamic Component 


Support for Java SE， 这 实际 就 是 OSGi R4.1) 。 由 于 模块 化 规范 主导 权 
的 重要 性 ，Sun 公 司 不 能 接受 一 个 无 法 由 它 控 制 的 规范 ， 在 整个 Java 
SE 6 期 间 都 拒绝 把 任何 模块 化 技术 内 置 到 JDK 之 中 。 在 Java SE 7 发 展 
初期 ，Sun 公 司 再 次 提交 了 一 个 新 的 规范 请 求 文档 JSR-294: Java 编 程 
语言 中 的 改进 模块 性 支持 (Improved Modularity Support in the Java 
Programming Language) ， 尽 管 这 个 JSR 仍 然 没 有 通过 ， 但 是 Sun 公 司 
已 经 独立 于 JCP 专 家 组 在 OpenJDK 里 建立 了 一 个 名 为 Jigsaw (拼图 ) 的 
子 项 目 来 推动 这 个 规范 在 Java 平 台中 转变 为 具体 的 实现 。Java 的 模块 
化 之 争 目 前 还 没有 结束 ，OSGi 已 经 发 布 到 R5.0 版 本 ， 而 Jigsaw 从 Java 7 
延迟 至 Java 8， 在 2012 年 7 月 叉 不 得 不 宜 布 推迟 到 Java 9 中 发 布 ， 从 这 
点 看 来 ，Sun 在 这 场 战争 中 人 处 于 劣势 ， 但 无 论 胜利 者 是 哪 一 方 ，Java 模 
块 化 已 经 成 为 一 项 无 法 阻挡 的 变革 潮流 。 


[1] 如 果 读 者 对 Java 模 块 化 之 争 感 兴趣 ， 可 以 阅读 笔者 的 男 外 一 本 书 
《深入 理解 OSGi:Equinox 原 理 、 应 用 与 最 佳 实践 》 的 第 1 章 。 


1.5.2 ”混合 语言 


当 单一 的 Java 开 发 已 经 无 法 满足 当前 软件 的 复杂 需求 时 ， 越 来 越 多 
基于 Java 虚 拟 机 的 语言 开发 被 应 用 到 软件 项 目 中 ，Java 平 台 上 的 多 语言 
混合 编程 正成 为 主流 ， 每 种 语言 都 可 以 针对 自己 擅长 的 方面 更 好 地 解 
决 问 题 。 试 想 一 下 ， 在 一 个 项 目 之 中 ， 并 行 处 理 用 Clojure 语 言 编 写 ， 
展示 层 使 用 JRubwRails， 中 间 层 则 是 Java， 每 个 应 用 层 都 将 使 用 不 同 的 
编程 语言 来 完成 ， 而 且 ， 搂 口 对 每 一 层 的 开发 者 都 是 透明 的 ， 各 种 语 
言 之 间 的 交互 不 存在 任何 困难 ， 就 像 使 用 自己 语言 的 原生 API 一 样 方便 
机 ， 因 为 它们 最 终 都 运行 在 一 个 虚拟 机 之 上 。 


在 最 近 的 几 年 里 ，Clojure、JRuby、Groovy 等 新 生 语 言 的 使 用 人 数 
不 断 增 长 ， 而 运行 在 Java 虚 拟 机 (JVM) 之 上 的 语言 数量 也 在 迅速 膨 
胀 ， 图 1-4 中 列举 了 其 中 的 一 部 分 。 这 两 点 证 明 混 合 编程 在 我 们 身边 已 
经 有 所 应 用 并 被 广泛 认可 。 通 过 特定 领域 的 语言 去 解决 特定 领域 的 问 
题 是 当前 软件 开发 应 对 日 趋 复杂 的 项 目 需 求 的 一 个 方向 。 
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图 1-4 可 以 运行 在 JVM 之 上 的 语言 (4 


除了 催生 出 大 量 的 新 语言 外 ， 许 多 已 经 有 很 长 历史 的 程序 语言 
出 现 了 基于 Java 虚 拟 机 实现 的 版 本 ， 这 样 使 得 混合 编程 对 许多 以 前 使 用 
其 他 语言 的 “ 老 ” 程 序 员 也 具备 相当 大 的 吸引 力 ， 软 件 企 业 投 入 了 大 量 
资本 的 现 有 代码 资产 也 能 很 好 地 保护 起 来 。 表 1-1 中 列举 了 第 见 语言 的 
JVM 实 现 版 本 。 


表 1-1 常见 语言 的 JVM 实现 版 本 


语 言 基于 JVM 实现 的 版 本 
Ada JGNAT 
AWK Jawk 
G C to Java Virtual Machine compilers 
Cobol Veryant is Cobol 
ColdFusion Adobe ColdFusion、Railo、Open BlueDragon 
Common Lisp Armed Bear Common Lisp、CLforJava、Jatha (Common LISP) 
Component Pascal Gardens Point Component Pascal 
Erlang Erjang 
Forth myForth 
JavaScript Rhino 
LOGO jLogo、XLogo 
Lua Kahlua、Luaj、Jill 
Oberon-2 Canterbury Oberon-2 for JVM 
Objective Caml (OCam!l) OCaml-Java 
Pascal Canterbury Pascal for JVM 
PHP IBM WebSphere sMash PHP (P8)、Caucho Quercus 
Python Jython 
Rexx IBM NetRexx 
Ruby JRuby 
Scheme Bigloo、 Kawa、SISC、JScheme 


对 这 些 运行 于 Java 虚 拟 机 之 上 、Java 之 外 的 语言 ， 来 自 系统 级 的 、 
底层 的 支持 正在 迅速 增强 ， 以 JSR-292 为 核心 的 一 系列 项 目 和 功能 改进 
(如 Da Vinci Machine 项 目 、Nashorm 引 警 、InvokeDynamic 指 令 
java.lang.invoke 包 等 ) ， 推 动 Java 虚 拟 机 从 “Java 语 言 的 虚拟 机 ”向 “多 语 
言 虚拟 机 ”的 方向 发 展 。 


[1] 在 同一 个 虚拟 机 上 运行 的 其 他 语言 与 Java 之 间 的 交互 一 般 都 比较 容 
易 ， 但 非 Java 语 言 之 间 的 交互 一 般 都 比较 烦琐 。dynalang 项 目 
(http://dynalang.sourceforge.net/) 就 是 为 了 解决 这 个 问题 而 出 现 的 。 


[2] 图 片 来 源 : http://www.Slideshare.net/josebetomex/o00ow-2009-towards-a- 


universal-vm ° 


1.5.3 ”多 核 并 行 


如 今 ，CPU 硬 件 的 发 展 方向 已 经 从 高 频率 转变 为 多 核心 ， 随 着 多 
核 时 代 的 来 临 ， 软 件 开发 越 来 越 关注 并 行 编程 的 领域 。 早 在 JDK 1.5 束 
已 经 引入 java.util.concurrent 包 实现 了 一 个 粗 粒 度 的 并 发 框架 。 而 JDK 
1.7 中 加 入 的 java.util.concurrent.forkjoin 包 则 是 对 这 个 框架 的 一 次 重要 扩 
充 。Fork/Join 模 式 是 处 理 并 行 编程 的 一 个 经 典 方法 ， 如 图 1-5 所 示 。 虽 
然 不 能 解决 所 有 的 问题 ， 但 是 在 此 模式 的 适用 范围 之 内 ， 能 够 轻松 地 
利用 多 个 CPU 核心 提供 的 计算 资源 来 协作 完成 一 个 复杂 的 计算 任务 。 
通过 利用 Fork/Join 模 式 ， 我 们 能 够 更 加 顺畅 地 过 渡 到 多 核 时 代 。 
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图 1-5 ”Fork/Join 模 式 示意 图 由 


在 Java 8 中 ， 将 会 提供 Lambda 支 持 ， 这 将 会 极 大 改善 日 前 Java 语 言 


不 适合 函数 式 编 程 的 现状 〈 目 前 Java 语 言 使 用 函数 式 编程 并 不 是 不 可 


以 ， 只 是 会 显得 很 爱 肿 )， 画 数 式 编 程 的 一 个 重要 优点 号 是 这 样 的 程 
序 天 然 地 适合 并 行 运行 ， 这 对 Java 语 言 在 多 核 时 代 继 续 保持 主流 语言 的 
地 位 有 很 大 帮助 。 


另外 ， 在 并 行 计算 中 必须 提 及 的 还 有 OpenJDK 的 子 项 目 
Sumatral”1， 目 前 显卡 的 算术 运算 能 力 、 并 行 能 力 已 经 远 远 超过 了 
CPU， 在 图 形 领 域 以 外 发 掘 显卡 的 潜力 是 近 几 年 计算 机 发 展 的 方向 之 
一 ， 例 如 C 语 言 的 CUDA。Sumatra 项 目 就 是 为 Java 提 供 使 用 GPU 

(Graphics Processing Units) 和 APU (Accelerated Processing Units) 运 
算 能 力 的 工具 ， 以 后 它 将 会 直接 提供 Java 语 言 层 面 的 API， 或 者 为 
Lambda 和 其 他 JVM 语 言 提供 底层 的 并 行 运 算 支 持 。 


在 JDK 外 围 ， 也 出 现 了 专 为 满足 并 行 计算 需求 的 计算 框架 ， 如 
Apache 的 Hadoop Map/Reduce， 这 古 一 个 简单 易 慌 的 并 行 框架 ， 能 够 运 
行 在 由 上 千 个 商用 机 右 组 成 的 大 型 集群 上 ， 并 且 能 以 一 种 可 徘 的 容错 
方式 并 行 处 理 TB 级 别 的 数据 集 。 另 外 ， 还 出 现 了 诸如 Scala、Clojure 及 
Erlang 等 天 生 束 具备 并 行 计算 能 力 的 语言 。 


[1] 图 片 来 源 : http://www.ibm.com/developerworks/cn/java/j-lo-forkjoin/。 


[2]Sumatra 项 目 主 页 : http://openjdk.java.net/projects/sumatra/。 


1.54 进一步 丰 吓 语 读 


Java 5 曾经 对 Java 语 法 进行 了 一 次 扩充 ， 这 次 扩充 加 入 了 上 自动 疼 
箱 、 汉 型 、 动 态 注 解 、 枚 举 、 可 变 长 参数 、 明 有 历 循 环 等 语法 ， 使 得 
Java 语 言 的 精确 性 和 易 用 性 有 了 很 大 的 进步 。 在 Java 7 (由 于 进度 压 
力 ， 许 多 改进 已 推迟 至 Java 8) 中 ， 对 Java 语 法 进行 了 另 一 次 大 规模 的 
扩充 。Sun (已 被 Oracle 收 购 ) 专门 为 改进 Java 语 法 在 OpenJDK 中 建立 
了 Coin 子 项 目 趾 来 统一 处 理 对 Java 语 法 的 细节 修改 ， 如 二 进 制 数 的 原 
生 文 持 、 在 switch 语 句 中 文 持 字符 串 、“< > ”操作 符 、 异 党 处 理 的 改 
进 、 简 化 变 长 参数 方法 调用 、 面 癌 资 源 的 try-catch-finally 语 句 等 都 是 在 
Coin 项 目 之 中 提交 的 内 容 。 


除了 Coin 项 目 之 外 ， 在 JSR-335 (Lambda Expressions for the Java 
TM Programming Language) 中 定义 的 Lambda 表 达 式 中 也 将 对 Java 的 语 
法 和 语言 习惯 产生 很 大 的 影响 ， 面 向 函 数 方式 的 编程 可 能 会 成 为 主 


\ 产 
;也 。 


[1]Coin 项 目 主 页 : http://wikis.sun.com/display/ProjectCoin/Home 。 
[2]Lambda 项 目 主页 : http://openjdk.java.net/projects/lambda/。 


1.5.5 ”64 位 虚拟 机 


在 儿 年 之 前 ， 主 流 的 CPU 束 开始 文 持 64 位 架构 了 。Java 虚 拟 机 也 
在 很 早 之 前 束 推 出 了 支持 64 位 系统 的 版 本 。 但 Java 程 序 运 行 在 64 位 虚 
拟 机 上 需要 付出 比较 大 的 额外 代价 : 首先 十 内 存 问题 ， 由 于 指针 膨胀 
和 各 种 数据 类 型 对 齐 补 日 的 原因 ， 运 行 于 64 位 系统 上 的 Java 应 用 需要 
消耗 更 多 的 内 存 ， 通 常 要 比 32 位 系统 额外 增加 10%~30% 的 内 存 消耗 ; 
其 次 ， 多 个 机 构 的 测试 结果 显示 ，64 位 虚拟 机 的 运行 速度 在 各 个 测试 
项 中 几乎 全 面 落后 于 32 位 虚拟 机 ， 两 者 大 约 有 15% 左 右 的 性 能 差距 。 


但 是 在 Java EE 方面 ， 企 业 级 应 用 经 常 需要 使 用 超过 4GB 的 内 存 ， 
对 于 64 位 虚拟 机 的 需求 是 非常 迫切 的 ,但 由 于 上 述 原因 ， 许 多 企业 应 
用 都 仍然 选择 使 用 虚拟 集群 等 方式 继续 在 32 位 虚拟 机 中 进行 部 署 。 
Sun 也 注意 到 了 这 些 问 题 ， 并 做 出 了 一 些 改善 ， 在 JDK 1.6 Update 14 之 
后 ， 提 供 了 普通 对 象 指针 压缩 功能 (-XX:+UseCompressedOops， 这 个 
参数 不 建议 显 式 设置 ， 建 议 维持 默认 由 虚拟 机 的 Ergonomics 机 制 自动 
开启 ) ， 在 执行 代码 时 ， 动 态 植 入 压缩 指令 以 节省 内 存 消耗 ， 但 是 开 
启 压缩 指针 会 增加 执行 代码 数量 ， 因 为 所 有 在 Java 堆 里 的 、 指 向 Java 
堆 内 对 象 的 指针 都 会 被 压缩 ， 这 些 指针 的 访问 就 需要 更 多 的 代码 才 可 
以 实现 ， 而 且 并 不 只 是 读 写 字段 才 受 影响 ， 在 实例 方法 调用 、 子 类 型 
检查 等 操作 中 也 受 影响 ， 因 为 对 象 实例 指向 对 象 类 型 的 引用 也 被 压缩 


了 。 随 着 硬件 的 进一步 发 展 ， 计 算 机 终究 会 完全 过 渡 到 64 位 的 时 代 ， 
这 是 一 件 豪 无 疑问 的 事情 ， 主 流 的 虚拟 机 应 用 也 终究 会 从 32 位 发 展 至 
64 位 ， 而 虚拟 机 对 64 位 的 支持 也 将 会 进一步 完善 。 


1.6 ”实战 : 目 己 编译 JDK 


想 要 一 探 JDK 内 部 的 实现 机 制 ， 最 便捷 的 路 径 之 一 就 是 自己 编译 一 
套 ]DK， 通 过 阅读 和 跟踪 调试 JDK 源 码 去 了 解 Java 技 术 体 系 的 原理 ， 虽 
然 门槛 会 高 一 点 ， 但 肯定 会 比 阅读 各 种 书籍 、 文 章 更 加 贴近 本 质 。 另 
外 ，JDK 中 的 很 多 底层 方法 都 是 本 地 化 (Native) 的 ， 需 要 跟踪 这 些 方 
法 的 运作 或 对 JDK 进 行 Hack 的 时 候 ， 都 需要 自己 编译 一 套 JDK。 


现在 网 络 上 有 不 少 开源 的 JDK 实 现 可 以 供 我 们 选择 ， 如 Apache 
Harmony、OpenJDK 等 。 考 虑 到 Sun 系 列 的 JDK 是 现在 使 用 得 最 广泛 的 
JDK 版 本 ， 笔 者 选择 了 OpenJDK 进 行 这 次 编译 实战 。 


1.6.1 获取 JDK 源 人 码 


首先 要 先 明 确 OpenJDK 和 Sun/OracleJDK 之 间 ， 以 及 OpenJDK 6、 
OpenJDK 7、OpenJDK 7u 和 OpenJDK 8 等 项 目 之 间 是 什么 关系 ， 这 有 助 
于 确定 接 下 来 编译 要 使 用 的 JDK 版 本 和 源码 分 文 。 


从 前 面 介绍 的 Java 发 展 史 中 我 们 了 解 到 OpenJDK 是 Sun 在 2006 年 末 
把 Java 开 源 而 形成 的 项 目 ， 这 里 的 “开源 ”是 通常 意义 上 的 源码 开放 形 
式 ， 即 源码 是 可 被 复 用 的 ， 例 如 IcedTeal1!1、UltraViolet* | 都 是 从 
OpenJDK 源 码 衍 生出 的 发 行 版 。 但 如 果 仅 从 “开源 ”字面 意义 (开放 可 


阅读 的 源码 ) 上 看 ， 其 实 Sun 自 JDK 1.5 之 后 就 开始 以 Java Research 
License (JRL) 的 形式 公布 过 Java 源 码 ， 主 要 用 于 研究 人 员 阅 读 (JRL 
许可 证 的 开放 源码 至 JDK 1.6 Update 23 为 止 ) 。 把 这 些 JREL 许 可 证 形式 
的 Sun/OracleJDK 源 码 和 对 应 版 本 的 OpenJDK 源 码 进行 比较 ， 发 现 除 了 
文件 头 的 版 权 注释 之 外 ， 其 余 代码 基本 上 都 是 相同 的 ， 只 有 字体 演 染 
部 分 存在 一 点 差异 ，Oracle JDK 采 用 了 商业 实现 ， 而 OpenJDK 使 用 的 是 
开源 的 FreeType。 当 然 ,“ 相 同 ” 是 建立 在 两 者 共有 的 组 件 基 础 上 的 ， 
Oracle JDK 中 还 会 存在 一 些 Open JDK 没 有 的 、 商 用 闭 源 的 功能 ， 例 如 
从 JRockit 移 植 改造 而 来 的 Java Flight Recorder 。 预 计 以 后 了 Rockit 的 
MissionControl 移 植 到 HotSpot 之 后 ， 也 会 以 Oracle JDK 专 有 、 闭 源 的 形 
式 提供 。 


Oracle 的 项 目 发 布 经 理 Joe Darcy 在 OSCON 2011 上 对 两 者 关系 的 介 
绍 B 也 证 实 了 OpenJDK 7 和 Oracle JDK 7 在 程序 上 是 非常 接近 的 ， 两 者 
共用 了 大 量 相同 的 代码 (如 图 1-6 所 示 ， 注 意图 中 提示 了 两 者 共同 代码 
的 占 比 要 远 高 于 图 形 上 看 到 的 比例 ) ， 所 以 我 们 编译 的 OpenJDK， 基 
本 上 可 以 认为 性 能 、 功 能 和 执行 逻辑 上 都 和 官方 的 Oracle JDK 是 一 至 
的 。 


“We have a lot in common.” 


Note: figure not drawn to Scale. 
More sharing than pictured. 


OpenjDK Oracle JDK 


Font renderer Flight recorder 


图 1-6 OpenJDK 和 Oracle JDK 之 间 的 关系 


再 来 看 一 下 OpenJDK 6、OpenJDK 7、OpenJDK 7u 和 OpenJDK 8 这 
几 个 项 目 之 间 的 关系 ， 从 图 1-7 (依然 是 从 Joe Darcy 的 OSCON 2011 演 
示 稿 中 截取 的 图 片 ) 来 看 ，OpenJDK 7 是 始 于 JDK 6 时 期 ， 当 时 JDK 6 
和 JDK 6 Update 1 已 经 发 布 ，JDK 7 已 经 开始 研发 了 ， 所 以 OpenJDK 7 是 
直接 基于 正在 研发 的 JDK 7 源码 建立 的 。 但 考虑 到 OpenJDK 7 的 状况 在 
当时 还 不 适合 实际 生产 部 署 ， 因 此 在 OpenJDK 7 Build 20 的 基础 上 建立 
了 OpenJDK 6 分 文 ， 和 剥离 掉 JDK 7 新 功能 的 代码 ， 形 成 一 个 可 以 通过 
TCK 6 测试 的 独立 分 文 。 


JDK 8 


http:/ihg.openjdk.java.netjdk8/dk8 


JDK 5 .b10 JDK 7U1 


se 有 直子 
. b20 http://hg.openjdk.java.netdk7u/jdk7u/ 


JDK 6 JDK 6 bo1...b23 


6u1 6u4 6u10 6u26 


图 1-7 OpenJDK 6、OpenJDK 7、OpenJDK 7u、OpenJDK 8 之 间 的 关 
系 


2012 年 7 月 ，JDK 7 正式 发 布 ， 在 OpenJDK 中 也 同步 建立 了 
OpenJDK 7 Update 项 目 对 JDK 7 进行 更 新 升级 ， 以 及 OpenJDK 8 项 目 开 
台 下 一 个 JDK 大 版 本 的 研发 。 按 照 开发 习惯 ， 新 的 功能 或 Bug 修 复 通 常 
是 在 最 新 分 文 上 进行 的 ， 当 功能 或 修复 在 最 新 分 文 上 稳定 之 后 会 同步 
到 其 他 老 版 本 的 维护 分 支 上 。 


OpenJDK 6、OpenJDK 7、OpenJDK 7u 和 OpenJDK 8 的 源码 都 可 以 
在 它们 相应 的 网 页 上 找到 ， 在 本 次 编译 实践 中 ， 笔 者 选用 的 项 目 是 
OpenJDK 7u， 版 本 为 7u6 。 


获取 OpenJDK 源 码 有 两 种 方式 ， 其 中 一 种 是 通过 Mercurial 代 人 码 版 
本 管理 工具 从 Repository 中 直接 取得 源码 (Repository 地 址 : 
http://hg.openjdk.java.net/jdk7wjdk7u) ， 获 取 过 程 如 以 下 代码 所 示 。 


hg clone http://hg.openjdk.java.net/jdk7u/jdk7u-dev 
cd jdk7u-dev 

chmod 755 get_source.sh 

./get_source.sh 


这 是 最 直接 的 方式 ， 从 版 本 管理 中 看 变更 轨迹 比 看 Release Note 效 
果 更 好 。 但 不 足 之 处 是 速度 太 慢 ， 虽 然 代 码 总 容量 只 有 300 MB 左右 ， 
但 是 文件 数量 太 多 ， 在 笔者 的 网 络 下 全 部 复制 到 本 地 需要 数 小 时 。 男 
外 ， 考 虑 到 Mercurial 不 如 Git、SVN、ClearCase 或 CVS 之 类 的 版 本 控制 
工具 那样 普及 ， 对 于 一 般 读 者 ， 建 议 采 用 第 二 种 方式 ， 即 直接 下 载 官 
方 打包 好 的 源码 包 ， 读 者 可 以 从 Source Bundle Releases 页 面 (地 址 : 
http://jdk7.java.net/source.html) 取得 打包 好 的 源码 ， 到 本 地 直接 解压 即 
可 。 一 般 来 说 ， 源 码 包 大 概 一 至 两 个 月 左右 会 更 新 一 次 ， 虽 然 不 够 及 
时 ， 但 比 起 从 Mercurial 复 制 代码 的 确 方便 和 快捷 许多 。 笔 者 下 载 的 是 
OpenJDK 7 Update 6 Build b21 版 源码 包 ，2012 年 8 月 28 日 发 布 ， 大 要 
99MB， 解 压 后 约 为 339MB 。 


[1lIcedTea: http://icedtea.classpath.org/wiki/Main_Page ° 

[21UltraViolet: https://www.reservoir.com/? d=uvform/form ° 

[3] 全 地 址 
https://blogs.oracle.com/darcy/resource/OSCON/oscon2011 OpenJDKState. 
pdf 。 


1.6.2 系统 需求 


如 果 可 能 ， 笔 者 建议 尽量 在 Linux、MacOS 或 Solaris 上 构建 
OpenJDK， 这 要 比 在 Windows 平 台 上 容易 得 多 ， 本 章 实战 中 笔者 将 以 
Ubuntu 10.10 和 MacOS X 10.8.2 为 例 进 行 构建 。 如 果 读 者 一 定 要 在 
Windows 平 台 上 完成 编译 ， 可 参考 本 书 附录 A， 该 附录 是 本 书 第 一 版 中 
介绍 如 何在 Windows 下 编译 OpenJDK 6 的 例子 ， 原 有 的 部 分 内 容 现 在 
已 经 过 时 了 《例如 安装 Plug 部 分 ) ， 但 还 是 有 一 定 参考 意义 ， 因 此 笔 
者 没有 把 它 删 除 掉 ， 而 是 移 到 附录 之 中 。 


无 论 在 什么 平台 下 进行 编译 ， 都 建议 读者 认真 阅读 一 遍 源码 中 的 
README-builds.html 文 档 (无 论 在 OpenJDK 网 站 上 还 是 在 下 载 的 源码 
包 中 都 有 这 份 文档 ) ， 因 为 编译 过 程 中 需要 注意 的 细节 非常 多 。 虽 然 
不 至 于 像 文 档 上 所 描述 的 “Building the source code for the JDK requires 


a high level of technical expertise.Sun provides the source code primarily 
for technical experts who want to conduct research. 〈 编 译 JDK 需 要 很 高 的 
专业 技术 ，Sun 提 供 JDK 源 码 是 为 了 技术 专家 进行 研究 之 用 ) "那么 众 
张 ， 但 是 如 果 读 者 是 第 一 次 编译 ， 那 有 可 能 会 在 一 些小 问题 上 耗费 许 
多 时 间 。 


在 本 次 编译 中 采用 的 是 64 位 操作 系统 ， 编 译 的 也 是 64 位 的 
OpenJDK， 如 果 需 要 编译 32 位 版 本 ， 那 建议 在 32 位 操作 系统 上 进行 。 
在 官方 文档 上 写 到 编译 OpenJDK 至 少 需要 512MB 的 内 存 和 600MB 的 们 
盘 空 间 。512MB 的 内 存 也 许 能 凌 合 使 用 ， 不 过 600MB 的 磁盘 空间 估计 
仅 是 指 存放 OpenJDK 源 码 所 需 的 空间 ， 要 完成 编译 ，600MB 肯 定 是 无 
论 如 何 都 不 够 的 ， 光 输出 的 编译 结果 就 有 近 3GB (因为 有 很 多 中 间 文 
件 ， 以 及 会 编译 出 不 同 优化 级 别 (Product、Debug、FastDebug 等 ) 的 
虚拟 机 ) ， 建 议 读者 至 少 保证 5GB 以 上 的 空余 磁盘 。 


对 系统 的 最 后 一 点 要 求 回 是 所 有 的 文件 ， 包 括 源 码 和 依赖 项 目 ， 
都 不 要 放 在 包 侣 中 文 的 目 孙 里 面 ， 这 样 做 不 是 一 定 不 可 以 ， 只 是 没有 
必要 给 目 己 找 麻烦 。 


1.6.3 构建 编译 环境 


在 MacOSI 和 Linux 上 构建 OpenJDK 编 译 环 境 比较 简单 (相对 于 
Windows 来 说 ) ， 对 于 Mac O0S， 需 要 安装 最 新 版 本 的 XCode 和 
Command Line Tools for XCode， 在 Apple Developer 网 站 

(https://developer.apple.com/) 上 可 以 免费 下 载 ， 这 两 个 SDK 包 提供 了 
OpenJDK 所 需 的 编译 器 以 及 Makefile 中 用 到 的 外 部 命令 。 另 外 ， 还 要 
准备 一 个 6u14 以 上 版 本 的 JDK， 因 为 OpenJDK 的 各 个 组 成 部 分 

(Hotspot、JDK API、JAXWS、JAXP......) 有 的 是 使 用 C++ 编 写 的 ， 
更 多 的 代码 则 是 使 用 Java 自 身 实现 的 ， 因 此 编译 这 些 Java 代 码 需要 用 
到 一 个 可 用 的 JDK， 官 方 称 这 个 JDK 为 "Bootstrap JDK"。 如 果 编 译 
OpenJDK 7，Bootstrap JDK 必 须 使 用 JDK6 Update 14 或 之 后 的 版 本 ， 笔 
者 选用 的 是 JDK7 Update 4°。 最 后 需要 下 载 一 个 1.7.1 以 上 版 本 的 Apache 
Ant， 用 于 执行 Java 编 译 代码 中 的 Ant 脚 本 。 


对 于 Linux 来 说 ， 所 需要 准备 的 依赖 与 Mac OS 差不多 ，Bootstrap 
JDK 和 Ant 都 是 一 样 的 ， 在 Mac OS 中 GCC 编 译 器 来 源 于 XCode SDK,， 
而 Ubuntu 中 GCC 应 该 是 默认 安装 好 的 ， 需 要 确保 版 本 为 4.3 以 上 ， 如 果 
没有 找到 GCC， 安 闭 binutils 即 可 ， 在 Ubuntu 10.10 下 编译 OpenJDK 7u4 
所 需 的 依赖 可 以 使 用 以 下 命令 一 次 安装 完成 。 


sudo apt-get install build-essential gawk m4 openjdk-6-jdk 


libasound2-dev libcups2-dev libxrender-dev xorg-dev xutils-dev 
x11iproto-print-dev binutils libmotif3 libmotif-dev ant 


[1] 注 意 ， 只 有 在 OpenJDK 7u4 和 之 后 的 版 本 才能 编译 出 Mac OS 系统 下 
的 JDK 包 ， 之 前 的 版 本 虽然 在 源码 和 编译 脚本 中 也 包含 了 Mac OSs 目 
录 ,， 但 是 尚未 完善 。 


1.6.4 ”进行 编译 


现在 需要 下 载 的 编译 环境 和 依赖 项 目 都 准备 齐全 了 ， 最 后 我 们 还 
需要 对 系统 的 环境 变量 做 一 些 简 单 设置 以 便 编 译 能 够 顺利 通过 。 
OpenJDK 在 编译 时 读 取 的 环境 变量 有 很 多 ， 但 大 多 都 有 默认 值 ， 必 须 
设置 的 只 有 两 个 LANG 和 ALT_BOOTDIR， 前 者 是 设 定语 言 选 项 ， 
必须 设置 为 : 


export LANG=C 


否则 ， 在 编译 结束 前 的 验证 阶段 会 出 现 一 个 HashTable 内 的 空 指 针 
异常 。 男 外 一 个 ALT_BOOTDIR 参 数 是 前 面 提 到 的 Bootstrap JDK， 在 
Mac OS 上 笔者 设 为 以 下 路 径 ， 其 他 操作 系统 读者 对 应 调整 即 可 。 

export 


ALT_BOOTDIR=/Library/Java/JavaVirtualMachines/jdk1.7.0_ 04.jdk/Conte 
nts/Home 


另外 ， 如 果 读 者 之 前 设置 了 JAVA_HOME 和 CLASSPATH 两 个 环境 
变量 ， 在 编译 之 前 必须 取消 ， 否 则 在 Makefile 脚 本 中 检查 到 有 这 两 个 


变量 存在 ， 会 有 警告 提示 。 


人 | 


性 


unset JAVA_HOME 
unset CLASSPATH 


其 他 环境 变量 笔者 就 不 再 一 一 介绍 了 ， 代 码 清单 1-1 给 出 笔者 自己 
常用 的 编译 Shell 脚 本 ， 读 者 可 以 参考 变量 注释 中 的 内 容 。 


代码 清单 1-1 环境 变量 设置 


I 


# 语 言 选项 ， 这 个 必须 设置 ， 否 则 编译 好 后 会 出 现 一 个 HashTable 的 NPE 多 

export LANG=C 

#Bootstrap JDK 的 安装 路 径 。 必 须 设置 

export 
ALT_BOOTDIR=/Library/Java/JavaVirtualMachines/jdk1.7.0_ 04.jdk/Conte 
nts/Home 

# 人 允许 自动 下 载 依赖 

export ALLOW_DOWNLOADS=true 

# 并 行 编译 的 线程 数 ， 设 置 为 和 CPU 内 核 数 量 一 致 即 可 

export HOTSPOT_BUILD_JOBS=6 

export ALT_PARALLEL_COMPILE_JOBS=6 

# 比 较 本 次 build 出 来 的 映像 与 先前 版 本 的 差异 。 这 对 我 们 来 说 没有 意义 ， 

# 必 须 设置 为 false， 否 则 sanity 检 查 会 报 缺 少 先 前 版 本 JDK 的 映像 的 错误 提示 。 

# 如 有 果 已 经 设置 dev 或 者 DEV_ONLY=true， 这 个 不 显 式 设置 也 行 

export SKIP_COMPARE_IMAGES=true 

# 使 用 预 编 译 头 文件 ， 不 加 这 个 编译 会 更 慢 一 些 

export USE_PRECOMPILED_HEADER=true 

# 要 编译 的 内 容 

export BUILD_LANGTOOLS=true 

#export BUILD_JAXP=false 

#export BUILD JAXWwS=false 

#export BUILD CORBA=false 

export BUILD_HOTSPOT=true 

export BUILD_JDK=true 

# 要 编译 的 版 本 

#export SKIP_DEBUG_ BUILD=false 

#export SKIP_FASTDEBUG_BUILD=true 

#export DEBUG_ NAME=debug 

# 把 它 设置 为 false 可 以 避 开 javaws 和 浏览 器 Java 插 件 之 类 的 部 分 的 build 

BUILD_DEPLOY=false 

# 把 它 设置 为 false 就 不 会 build 出 安装 包 。 因 为 安装 包 里 有 些 奇 怪 的 依赖 ， 

# 但 即便 不 build 出 它 也 已 经 能 得 到 完整 的 JDK 映 像 ， 所 以 还 是 别 puild 它 好 了 

BUILD_INSTALL=false 

# 编 译 结果 所 存放 的 路 径 

export 
ALT_OUTPUTDIR=/Users/IcyFenix/Develop/JVM/jdkBuild/openjdk_7u4/buil 
d 


# 这 两 个 环境 变量 必须 去 掉 ， 不 然 会 有 很 诡异 的 事情 发 生 (我 没有 具体 查 过 这 些 "诡异 的 


# 事 情 " ，Makefile 脚 本 检查 到 有 这 2 个 变量 就 会 提示 警告) 
unset JAVA_HOME 

unset CLASSPATH 

make 2>&1|tee $ALT_OUTPUTDIR/build.1og 


全 部 设置 结束 之 后 ， 可 以 输入 make sanity 来 检查 我 们 前 面 所 做 的 
设置 是 否 全 部 正确 。 如 果 一 切 顺 利 ， 那 么 几 秒 钟 之 后 会 有 类 似 代码 清 
单 1-2 所 示 的 输出 。 


代码 清单 1-2 make sanity 检 查 


~/Develop/JVM/jdkBuild/openjdk_7u4$make sanity 
Build Machine Information: 

build machine=IcyFenix-RMBP .local 

Build Directory Structure: 
CWD=/Users/IcyFenix/Develop/JVM/jdkBuild/openjdk_7u4 
TOPDIR=. 

LANGTOOLS_TOPDIR=./langtools 

JAXP_TOPDIR=. /jaxp 

JAXWS_TOPDIR=. /jaxws 

CORBA_TOPDIR=. /corba 

HOTSPOT_ TOPDIR=. /hotspot 

JDK_TOPDIR=. /jdk 

Build Directives: 

BUILD_LANGTOOLS=true 

BUILD_JAXP=true 

BUILD_JAXWS=true 

BUILD_CORBA=true 

BUILD_HOTSPOT=true 

BUILD_JDK=true 

DEBUG_CLASSFILES= 

DEBUG_BINARIES= 

a 因 篇 幅 关 系 ， 中 间 省 略 了 大 量 的 输出 内 容 … 
OpenJDK-specific settings: 
FREETYPE_HEADERS_PATH=/Uusr/X11R6/include 
ALT_FREETYPE_HEADERS_PATH= 
FREETYPE_LIB_PATH=/usSr/X11R6/1ib 
ALT_FREETYPE_LIB_PATH= 

Previous JDK Settings: 
PREVIOUS_RELEASE_PATH=USING-PREVIOUS_RELEASE_IMAGE 
ALT_PREVIOUS_RELEASE_PATH= 


PREVIOUS_JDK_VERSION=1.6.0 

ALT_PREVIOUS_JDK_VERSION= 

PREVIOUS_JDK_FILE= 

ALT_PREVIOUS_JDK_FILE= 

PREVIOUS_JRE_FILE= 

ALT_PREVIOUS_JRE_FILE= 

PREVIOUS_RELEASE_IMAGE=/Library/Java/JavaVirtualMachines/jdk1.7. 
0_04.jdk/Contents/Home 

ALT_PREVIOUS_RELEASE_IMAGE= 


Sanity check passed. 


Makefile 的 Sanity 检 查 过 程 输出 了 编译 所 需 的 所 有 环境 变量 ， 如 果 
看 到 "Sanity check passed."， 说 明 检 查 过 程 通过 了 ， 可 以 输入 "make" 执 
行 整个 OpenJDK 编 译 (make 不 加 参数 ， 默 认 编 译 make all) ， 笔 者 使 
用 Core i7 3720QM/16GB RAM 的 MacBook 机 器 ， 启 动 6 条 编译 线程 ， 全 
量 编 译 整 个 OpenJDK 大 概 需 20 分 钟 ， 编 译 结束 后 ， 将 输出 类 似 下 面 的 
日 志清 单 所 示 内 容 。 如 果 读 者 之 前 已 经 全 量 编译 过 ， 只 修改 了 少量 文 
件 ， 增 量 编译 可 以 在 数 十 秒 内 完成 。 


#--Build times---------- 
Target all product_build 
Start 2012-12-13 17:12:19 
End 2012-12-13 17:31:07 
00:01:19 corba 

00:01:15 hotspot 
00:00:14 jaxp 

00:7:21 jaxws 

00:8:11 jdk 

00:00:28 langtools 
00:18:48 TOTAL 


编译 完成 之 后 ， 进 入 OpenJDK 源 码 下 的 build/j2sdk-image 目 录 (或 
者 build-debug、build-fastdebug 这 两 个 目录 ) ， 这 是 整个 JDK 的 完整 编 
译 结果 ， 复 制 到 JAVA_HOME 目 录 ， 束 可 以 作为 一 个 完整 的 JDK 使 
用 ， 编 译 出 来 的 虚拟 机 ， 在 -version 命 令 中 带 有 用 户 的 机 器 名 。 

> ./java-version 

openjdk version"1.7.0-internal-fastdebug" 

OpenJDK Runtime Environment (build1.7.0-internal-fastdebug- 


icyfenix 2012 12 24 _15_57-b90) 
OpenJDK 64-Bit Server VM (build 23.0-b21-fastdebug,mixed mode) 


在 大 多 数 时 候 ， 如 果 我 们 并 不 关心 JDK 中 HotSpot 虚 拟 机 以 外 的 内 
容 ， 只 想 单 独 编 译 HotSpot 虚 拟 机 的 话 (例如 调试 虚拟 机 时 ， 每 次 改动 
程序 都 执行 整个 OpenJDK 的 Makefile， 速 度 肯定 受 不 了 ) ， 那 么 使 用 
hotspotmake 目 孙 下 的 Makefile 进 行 奉 换 即 可 ， 其 他 参数 设置 与 前 面 是 
一 致 的 ， 这 时 候 虚 拟 机 的 输出 结果 存放 在 
build/hotspotoutputdivbsd_amd64_compiler2 目 录 册 中 ， 进 入 后 可 以 见 
到 以 下 几 个 目录 。 


drwxr-xr-x 15 IcyFenix Staff 510B 12 13 17:24 debug 
drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:24 fastdebug 
drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:25 generated 
drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:24 jvmg 
drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:24 optimized 
drwxr-xr-x 584 IcyFenix Staff 19K 12 13 17:25 product 
drwxr-xr-x 15 IcyFenix staff 510B 12 13 17:24 profiled 


OOOOOoOoo 


这 些 目 录 对 应 了 不 同 的 优化 级 别 ， 优 化 级 别 越 高 ， 性 能 目 然 束 越 
好 ,但 是 输出 代码 与 源码 的 差距 束 越 大 ， 难 于 调试 ， 具 体 哪 个 目录 有 
内 容 ， 取 决 于 make 命 令 后 面 的 参数 。 


在 编译 结束 之 后 、 运 行 虚 拟 机 之 前 ， 还 要 手工 编辑 目录 下 的 env.sh 
文件 ， 这 个 文件 由 编译 脚本 自动 产生 ， 用 于 设置 虚拟 机 的 环境 变量 ， 
里 面 已 经 发 布 了 "JAVA_HOME、CLASSPATH、 
HOTSPOT_BUILD_USER"3 个 环境 变量 ， 还 需要 增加 一 
个 "LD_LIBRARY_PATH"， 内 容 如 下 : 

LD_LIBRARY_PATH=. :${JAVA_HOME}/jre/lib/amd64/native_threads:${JA 


VA_HOME}/jre/lib/amd64: 
export LD_LIBRARY_PATH 


然后 执行 以 下 命令 启动 虚拟 机 (这 时 的 局 动 器 名 为 gamma) ， 输 
出 版 本 号 。 


,./env.sh 

./gamma-version 

Using java runtime 
at:/Library/Java/JavaVirtualMachines/jdk1.7.0 04.jdk/Contents/Home/ 
jre 

Java version"1.7.0_04" 

Java (TM) SE Runtime Environment (build 1.7.0 04-b21) 

OpenJDK 64-Bit Server VM (build 23.0-b21, mixed mode) 


看 到 目 己 编译 的 虚拟 机 成 功 运行 起 来 ， 很 有 成 束 感 吧 | 


[1] 在 不 同 机 器 上 ， 最 后 一 个 目录 名 称 会 有 所 差别 ，bsd 表 示 Mac OS 系 
统 (内 核 为 FreeBSD) ，amd64 表 示 是 64 位 JDK (32 位 是 x86) ， 


compiler2 表 示 是 Server VM (Client VM 表示 是 compiler1) 。 


1.6.5 在 IDE 工 具 中 进行 源码 调试 


在 阅读 OpenJDK 源 码 的 过 程 中 ， 经 常 需要 运行 、 调 试 程序 来 帮助 
理解 。 我 们 现在 已 经 可 以 编译 出 一 个 调试 版 本 HotSpot 虚 拟 机 ， 禁 用 优 
化 ， 并 带 有 符号 信息 ， 这 样 就 可 以 使 用 GDB 来 进行 调试 了 。 据 笔者 了 
解 ， 许 多 对 虚拟 机 了 解 比较 深 的 开发 人 员 确 实 束 是 直接 使 用 GDB 加 
VIM 编 辑 絮 来 开发 、 修 改 HotSpot 的 ， 不 过 相信 大 部 分 读者 更 倾 同 于 在 
IDE 环 境 而 不 是 纯 文本 的 GDB 下 阅读 、 跟 踪 HotSpot 源 码 ， 因 此 这 市 束 
简单 介绍 一 下 “如 何在 IDE 中 进行 HotSpot 源 码 调试 ”。 


首先 ， 到 NetBeans 网 站 (http://netbeans.org/) 上 下 载 最 新 版 的 
NetBeans， 下 载 时 选择 支持 C/C++ 开发 的 那个 版 本 。 安 装 后 ， 新 建 一 个 
项 目 ， 选 择 “ 基 于 现 有 源 代码 的 C/C++ 项 目 ”， 在 源码 文件 夹 中 填 入 
OpenJDK 目 录 下 hotspot 目 录 的 路 径 ， 在 下 面 的 单 选 按钮 中 选择 “定制 ”， 
如 图 1-8 所 示 ， 然 后 单 击 “下 一 步 * 按 钮 。 


选择 模式 
指定 包含 现 有 源 代码 的 文件 夹 (E): 
‘Develop/JYM/jdkBuild/openjdk_7u4/hotspot "| | 浏览 W)..， | 


构建 主机 (B): | localhost 


工具 集合 (D: | 默认 (GNU (CNU Mac 编译 器 集合 ) 


选择 配置 模式 (M): 
C) 自动 (使 用 Makefile)(A) 
人) 定制 (O) 
在 "定制 "模式 下 , 可 以 查看 和 更 改 用 于 配置 项 目的 设置 。 


| 帮助 H) |] | < 上 一 步 B) | 


图 1-8 在 NetBeans 中 创建 HotSpot 项 目 (1) 


接着 ， 在 “指定 构建 代码 的 方法 ?中 选择 “使 用 现 有 的 makefile"， 并 
填 入 Makefile 文 件 的 路 径 (在 hotspot/make 目 录 下 ) ， 如 图 1-9 所 示 。 单 
击 “ 下 一 步 " 按 钮 ， 将 “构建 命令 "修改 为 以 下 内 容 

${MAKE}-f Makefile clean jvmg 


ALT_BOOTDIR=/Library/Java/JavaVirtualMachines/jdk1.7.0_ 04.jdk/Con 
tents/Home ARCH_DATA MODEL=64 LANG=C 


新 建 项 目 


步骤 构建 工具 
， 选择 项 目 指定 构建 代码 的 方法 。 
本 (e) 使 用 现 有 的 makefile(M) 
; 人 现 有 的 Makefile(E): |iopenjdk_7u4/hotspotjmake/Makefile | 浏览 (R)... 
。 代码 帮助 配置 [ 完成 后 清理 并 生成 (D) 
〇 使 用 ' 配 置 ' 脚本 生成 的 makefile(C) 
配置 昼 本 (S$) | 览 (W)... 
配置 参数 (A) 
在 子 文件 夹 中 运行 配置 脚本 (U) 
build 
生成 的 Makefile(G) 
V 完成 后 运行 配置 脚本 (R) 


选择 "使 用 现 有 的 makefile", 然后 指定 现 有 的 makefile 可 以 构建 代码 。 选 择 "使 用 配 
置 脚 本 构建 的 makefile" 可 以 使 用 现 有 配置 脚本 构建 makefile, 从 而 构建 代码 。 


[| 帮助 H) | | < 上 - 步 @B) | | 下 - 步 > _ E 成 (F) | 取消 | 


图 1-9 在 NetBeans 中 创建 HotSpot 项 目 (2) 


OpenJDK 7u4 源 码 Makefile 在 终端 运行 时 能 正确 获取 到 系统 指令 集 
狠 构 为 64 位 ， 但 在 NetBeans 中 却 没有 取得 正确 的 值 ， 误 认为 是 32 位 ， 
因此 这 里 必须 使 用 ARCH_DATA_MODEL 参 数 明确 指定 为 64 位 。 另 外 
两 个 参数 ALT_BOOTDIR 和 LANG 的 作用 前 面 已 经 介绍 过 。 单 击 “ 完 
成 ”按钮 ，HotSpot 项 目 就 这 样 导入 到 NetBeans 中 了 。 


不 过 ， 这 时 候 HotSpot 还 运行 不 起 来 ， 因 为 NetBeans 根 本 不 知道 编 
译 出 来 的 结果 放 在 哪里 、 哪 个 程序 是 虚拟 机 的 入 口 等 ， 这 些 内 容 都 需 


要 明确 告知 NetBeans。 在 HotSpot 工 程 上 单 击 右键 ， 在 弹出 的 快捷 琳 单 
中 选择 “属性 *"， 在 弹出 的 对 话 框 中 找到 “运行 ”选项 ， 设 置 运行 命令 为 : 


/Users/IcyFenix/Develop/JVM/jdkBuild/openjdk_7u4/hotspot/build/bs 
d/bsd_amd64_compiler2/jvmg/gamma Queens 


上 面 的 Queens 是 Makefile 肝 本 自动 产生 的 一 段 解 八 皇后 问题 的 Java 
程序 ， 用 于 测试 虚拟 机 ， 这 里 笔者 直接 拿 来 用 了 ， 读 者 完全 可 以 将 它 
替换 为 自己 的 Java 程 序 。 


读者 在 调试 Java 代 码 执行 时 ， 如 果 要 跟踪 具体 Java 代 码 在 虚拟 机 中 
征 如 何 执行 的 ， 也 许 会 觉得 无 从 下 手 ， 因 为 目前 在 HotSpot 主 流 的 操作 
系统 上 ， 都 采用 模板 解释 器 来 执行 字 节 码 ， 它 与 IT 编 译 器 一 样 ， 最 终 
执行 的 汇编 代码 都 是 运行 期 间 产 生 的 ， 无 法 直接 设置 断 点 ， 所 以 
HotSpot 增 加 了 以 下 参数 来 方便 开发 人 员 调 试 解释 锻 。 


-XX:+TraceBytecodes-XX:StopInterpreterAt=<n> 
这 组 参数 的 作用 是 当 巡 到 序号 为 <n> 的 字 市 码 指 令 时 ， 便 会 中 断 


程序 执行 ， 进 入 断 点 调试 。 在 调试 解释 器 部 分 代码 时 ， 把 这 两 个 参数 
加 到 gamma 后 面 即 可 。 


最 后 ， 还 需要 在 “环境 ”窗口 中 设置 环境 变量 ， 也 就 是 前 面 env.sh 脑 
本 所 设置 的 那 几 个 环境 变量 ， 如 图 1-10 所 示 。 


项 目 属性 - hotspot 


| 配置:| Default (活动 ) “#] 「 管理 配置 (M)..， | 


了 常规 
运行 命令 /Users /IcyFenix/Develop/JVM/jdk... 3 


| 运行 目录 /Users /IcyFenix/Develop/JVM/jdkBui... | 
| 环境 LD_LIBRARY_PATH=/Users /IcyFenix/... 


首先 构建 
| | 控制 台 类 型 内 部 终端 


1 


值 

/Users /lcyFenix/Develop /JVM/jdkBuild /openjdk... 
/Ubrary/Java /JavaVirtualMachines/jdk1.7.0_04.... 
-SUAVA_HOME}/jre /lib/rt.jar: SUAVA_HOME}/Ir... 


图 1-10 在 NetBeans 中 创建 HotSpot 项 目 (3) 


完成 以 上 配置 之 后 ， 一 个 可 修改 、 编 译 、 调 试 的 HotSpot 工 程 就 完 
全 建立 起 来 了 ， 启 动 器 的 执行 入 口 是 java.c 的 main() 方 法 ， 读 者 可 以 设 
置 断 点 单 步 跟 踪 ， 如 图 1-11 所 示 。 


好 hotspot ~ NetBeans IDE 7.2.1 


Users/IcyFenix/Develop 


' 
~ 


Ei 


char *classname = 0; 

char *s = 0; 

char *main_class = NULL; 

int ret; 

InvocationFunctions ifn; 

jlong start, end; 

char jrepath [MAXPATHLEN] ，jvmpath [MAXPATHLEN]; 
char w* original_argv = 


S$ 


goes 


if (getenv("_JAVA_LAUNCHER_DEBUG") != 9) { 
_launcher_debug = JNI TRUE; 
printf("———_JAVA_LAUNCHER_DEBYG———\n"); 


5 
巴 
已 
> 
>» 
» 
» 
入 
» 
>» 
入 
» 
» 
» 
» 


| 


图 1-11 在 NetBeans 中 创建 HotSpot 项 目 (4) 


由 于 HotSpot 的 源码 比较 长 ，C/C++ 文 件数 量 也 很 多 ， 为 了 便于 读 
者 阅读 ， 所 以 代码 清单 1-3 给 出 了 各 个 目录 中 代码 的 主要 用 途 ， 供 读者 


参考 。 


代码 清单 1-3 HotSpot 源码 结构 由 


hotspot 


上 一 agent Serviceability Agent 的 实现 

上 一 make 用 来 build 出 HotSpot 的 各 种 配置 文件 
一 src HotSpot VM 的 源 代 码 

| HF— cpu CPU 相关 代码 

OE 操作 系 相 关 代码 

| Hos_cpu 操作 系统 +CPU 组 合 的 相关 代码 

| 上 一 share 平台 无 关 的 共通 代码 

| 上 一 tools 工具 

| | + 一 hsdis 反 汇 编 插件 

| | HF— IdealGraphVisualizer 将 Server 编译 器 的 中 间 代 码 可 视 化 的 工具 
| | 上 一 1auncher 启动 程序 "java" 

| | 


上 一 LogCcompilation 将 -XX:+LogCompilation 输出 的 日 志 (hotspot.1og) 


上 一 test 


[1] 


目 采 结 


上 一 ProjectCreator 


一 一 adlc 

上 一 asm 

-一 el 

-一 二 

上 一 classiile 
上 一 code 


一 -一 compiler 
上 一 gc_implementation 
| HF concurrentMarkSweep 


el 
| HparallelScavenge 


| 上 一 parNew 
| [一 shared 
一 一 gc interface 


+ 一 interpreter 


HF— libadt 
上 一 memory 
一 一 oops 
一 一 opto 


一 一 prims 
一 一 runtime 
HF— services 


上 一 shark 


上 -一 utilities 


整理 成 更 容易 阅读 的 格式 的 工具 
生成 Visual Studio 的 project 文件 的 工具 


HotSpot VM 的 核心 代码 


FE 侣 描述 文件 《上面 的 cpu 或 os_cpu 里 的 *.ad 
文件 ) 的 编译 器 
汇编 器 接口 
Client 编译 器 
动态 编译 器 的 公共 服务 / 接口 
类 文件 的 处 理 ( 包 括 类 加 载 和 系统 符号 表 等 ) 
动态 生成 的 代码 的 管理 
编译 器 接口 
GC 的 实现 
Concurrent Mark Sweep GC 的 实现 
Garbage-First GC 的 实现 (不 使 用 老 的 分 代 
式 GC 框架 ) 
ParallelScavenge GC 的 实现 (Server VM 
默认 ， 不 使 用 老 的 分 代 式 GC 框架 》 
ParNew GC 的 实现 
GC 的 共通 实现 
GC 的 接口 
解释 器 ， 包 括 " 模板 解释 器 "(官方 版 在 用 ) 和 
"C++ 解释 器 "(官方 版 不 再 用 》 
一 些 抽象 数据 结构 
内 存 管 理 相 关 〔( 老 的 分 代 式 GC 框架 也 在 这 里 ) 
HotSpot VM 的 对 象 系统 的 实现 
Server 编译 器 
HotSpot VM 的 对 外 接口 ， 包 括 部 分 标准 库 的 
native 部 分 和 JVMTI 实现 
运行 时 支持 库 ( 包 括 线 程 管理 、 编 译 器 调度 、 锁 、 
反射 等 ) 
主要 是 用 来 支持 JMX 之 类 的 管理 功能 的 接口 
基于 LLVM 的 JIT 编译 器 《官方 版 里 没有 使 用 ) 
一 些 基本 的 工具 类 


单元 测试 


构 由 


RednaxelaFX 整理 


http:/hllvm.group.iteye.comy/group/topic/26998。 


1.7 本 章 小 结 


本 章 介 绍 了 Java 技 术 体系 的 过 去 、 现 在 以 及 未 来 的 一 些 发 展 趋 
势 ， 并 通过 实战 介绍 了 如 何 自 己 来 独立 编译 一 个 OpenJDK 7。 作 为 全 
书 的 引言 部 分 ， 本 章 建 立 了 后 文 研究 所 必需 的 环境 。 在 了 解 Java 技 术 
的 来 龙 去 脉 后 ， 后 面 草 节 将 分 为 4 部 分 去 介绍 Java 在 内 存 管理 、Class 文 
件 结构 与 执行 引擎 、 编 译 器 优化 及 多 线程 并 发 方面 的 实现 原理 。 


第 二 部 分 “ 目 动 内 存 管理 机 制 


第 2 章 ”Java 内 存 区 域 与 内 存 洲 出 异 沼 
第 3 章 ”垃圾 收集 器 与 内 存 分 配 策略 
第 4 章 ”虚拟 机 性 能 监控 与 故障 处 理工 具 


第 5 章 ，” 调 优 案例 分 析 与 实战 
第 2 章 ”Java 内 存 区 域 志 内存 盗 出 异 季 


Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 
的 “高 墙 "， 墙 外 面 的 人 想 进 去 ， 墙 里 面 的 人 却 想 出 来 。 


2.1 概述 


对 于 从 事 C、C++ 程 序 开发 的 开发 人 员 来 说 ， 在 内 存 管理 领域 ， 他 
们 既 且 拥有 骤 高 权力 的 “ 旦 帝 ” 又 是 从 事 最 基础 工作 的 “ 攻 动 人 民 ' 一 一 
既 拥 有 每 一 个 对 象 的 "所 有 权 ”， 又 担负 着 每 一 个 对 象 生命 开始 到 终结 
的 维护 责任 。 


对 于 Java 程 序 员 来 说 ， 在 虚拟 机 目 动 内 存 管理 机 制 的 帮助 下 ， 不 
再 需要 为 每 一 个 new 操 作 去 写 配 对 的 delete/free 代 码 ， 不 容易 出 现 内 存 
泄漏 和 内 存 溢出 问题 ， 由 虚拟 机 管理 内 存 这 一 切 看 起 来 都 很 美好 。 不 
过 ， 也 正 是 因为 Java 程 序 员 把 内 存 控制 的 权力 交 给 了 Java 虚 拟 机 ， 一 
旦 出 现 内 存 泄漏 和 次 出 方面 的 问题 ， 如 采 不 了 解 虚拟 机 古 怎 样 使 用 内 
存 的 ， 那 么 排查 错误 将 会 成 为 一 项 异常 艰难 的 工作 。 


本 章 是 第 二 部 分 的 第 1 章 ， 笔 者 将 从 概念 上 介绍 Java 虚 拟 机 内 存 的 
各 个 区 域 ， 讲 解 这 些 区 域 的 作用 、 服 务 对 象 以 及 其 中 可 能 产生 的 问 
题 ， 这 是 翻越 虚拟 机 内 存 管 理 这 墙 围墙 的 第 一 步 。 


2.2 ”运行 时 数据 区 域 


Java 虚 拟 机 在 执行 Java 程 序 的 过 程 中 会 把 它 所 管理 的 内 存 划分 为 
若干 个 不 同 的 数据 区 域 。 这 些 区 域 都 有 各 自 的 用 途 ， 以 及 创建 和 销毁 
的 时 间 ， 有 的 区 域 随 着 虚拟 机 进程 的 启动 而 存在 ， 有 些 区 域 则 依赖 用 
户 线程 的 启动 和 结束 而 建立 和 销毁 。 根 据 《Java 虚 拟 机 规范 (Java SE 
7 版 ) 》 的 规定 ，Java 虚 拟 机 所 管理 的 内 存 将 会 包括 以 下 几 个 运行 时 数 
据 区 域 ， 如 图 2-1 所 示 。 


方法 区 虚拟 本 地 方法 村 
Method Ar Wa Hative Mathod 
eh 本 Stack 
堆 程序 计数 器 
Heap Proaram Counter Reeister 


执行 3 荀 ” ”加 本地 庄 接口 本地 放流 库 


| | 由 所 有 战 程 共享 的 数据 区 
| “| 总 程 咏 高 的 数据 区 


2-1 _ Java 虚拟 机 运行 时 数据 区 


2.2.1 程序 计数 怖 


程序 计数 器 (Program Counter Register) 是 一 块 较 小 的 内 存 空间 ， 
它 可 以 看 作 古 当前 线程 所 执行 的 字 市 码 的 行 号 指示 器 。 在 虚拟 机 的 概 
念 模型 里 〈 仅 是 概念 模型 ， 各 种 虚拟 机 可 能 会 通过 一 些 更 高 效 的 方式 
实现 ) ， 字 万 码 解释 器 工作 时 台 是 通过 改变 这 个 计数 需 的 值 来 选取 
需要 执行 的 字 万 码 指令 ， 分 文 、 循 环 、 跳 转 、 有 异常 处 理 、 线 程 
恢复 等 基础 功能 都 需要 依赖 这 个 计数 融 来 完成 。 


站 


i 


一 条 


人 


有 


由 于 Java 虚 拟 机 的 多 线程 是 通过 线程 轮流 切换 并 分 配 处 理 需 执行 
时 间 的 方式 来 实现 的 ， 在 任何 一 个 确定 的 时 刻 ， 一 个 处 理 器 “对 于 多 
核 处 理 絮 来 说 是 一 个 内 核 ) 都 只 会 执行 一 条 线程 中 的 指令 。 因 此 ， 为 
了 线程 切换 后 能 恢复 到 正确 的 执行 位 置 ， 每 条 线程 都 需要 有 一 个 独立 
的 程序 计数 器 ， 各 条 线程 之 间 计 数 硬 互 不 影响 ， 独 立 存 储 ， 我 们 称 这 
类 内 存 区 域 为 “线程 私有 ”的 内 存 。 


如 果 线 程 正在 执行 的 是 一 个 Java 方 法 ， 这 个 计数 妖 记 录 的 是 正在 
执行 的 虚拟 机 字 市 码 指 令 的 地 址 ， 如 采 正 在 执行 的 是 Native 方 法 ， 这 
个 计数 器 值 则 为 空 (Undefined) 。 此 内 存 区 域 是 唯一 一 个 在 Java 虚 拟 
机 规范 中 没有 规定 任何 OutOfMemoryError 情 况 的 区 域 。 


2.2.2 ”Java 虚拟 机 栈 


与 程序 计数 器 一 样 ，Java 虚 拟 机 栈 (Java Virtual Machine Stacks) 
也 是 线程 私有 的 ， 它 的 生命 周期 与 线程 相同 。 虚 拟 机 栈 描 述 的 是 Java 
方法 执行 的 内 存 模型 : 每 个 方法 在 执行 的 同时 都 会 创建 一 个 栈 帧 
(Stack Framel"1) 用 于 存储 局 部 变量 表 、 操 作 数 栈 、 动 态 链 接 、 方 法 
出 口 等 信息 。 每 一 个 方法 从 调用 直至 执行 完成 的 过 程 ， 束 对 应 着 一 个 
栈 帧 在 虚拟 机 栈 中 入 栈 到 出 栈 的 过 程 。 


经 党 有 人 把 Java 内 存 区 分 为 堆 内 存 (Heap) 和 栈 内 存 (Stack) ， 
这 种 分 法 比较 粗糙 ，Java 内 存 区 域 的 划分 实际 上 远 比 这 复杂 。 这 种 划 
分 方式 的 流行 只 能 说 明 大 多 数 程 序 员 最 关注 的 、 与 对 象 内 存 分 配 关 系 
最 密切 的 内 存 区 域 是 这 两 块 。 其 中 所 指 的 “ 堆 ” 笔 者 在 后 面 会 专门 讲 
述 ， 而 所 指 的 “ 栈 ? 束 是 现在 讲 的 虚拟 机 栈 ， 或 者 说 是 虚拟 机 栈 中 局 部 


局 部 变量 表 存 放 了 编译 期 可 知 的 各 种 基本 数据 类 型 (boolean、 
byte、char、short、int、float、long、double) 、 对 象 引 用 (reference 
类 型 ， 它 不 等 同 于 对 象 本 身 ， 可 能 是 一 个 指向 对 象 起 始 地 址 的 引用 指 
针 ， 也 可 能 是 指向 一 个 代表 对 象 的 句柄 或 其 他 与 此 对 象 相关 的 位 置 ) 
和 returnAddress 类 型 〈 指 向 了 一 条 字 节 码 指令 的 地 址 ) 。 


其 中 64 位 长 度 的 Iong 和 double 类 型 的 数据 会 占用 2 个 局 部 变量 空间 
(Slot) ， 其 余 的 数据 类 型 只 占用 1 个 。 局 部 变量 表 所 需 的 内 存 空 间 在 
编译 期 间 完成 分 配 ， 当 进入 一 个 方法 时 ， 这 个 方法 需要 在 帧 中 分 配 多 
大 的 局 部 变量 空间 是 完全 确定 的 ， 在 方法 运行 期 间 不 会 改变 局 部 变量 
表 的 大 小 。 


在 Java 虚 拟 机 规范 中 ， 对 这 个 区 域 规定 了 两 种 异常 状况 : 如 采 线 
程 请 求 的 栈 深度 大 于 虚拟 机 所 允许 的 深度 ， 将 抛 出 StackOverflowError 
异 肖 如果 虚拟 机 栈 可 以 动态 扩展 (当前 大 部 分 的 Java 虚 拟 机 都 可 动 
态 扩 展 ， 只 不 过 Java 虚 拟 机 规范 中 也 允许 固定 长 度 的 虚拟 机 栈 ) ， 如 
条 扩 展 时 无 法 申请 到 足够 的 内 存 ， 风 会 抛 出 DutOfMemoryError 寞 遂 。 


上 ] 栈 帧 是 方法 运行 时 的 基础 数据 结构 ， 在 本 书 的 第 8 章 中 会 对 帧 进行 
详细 讲解 。 


2.2.3 ”本 地 方法 栈 


本 地 方法 栈 (Native Method Stack) 与 虚拟 机 栈 所 发 挥 的 作用 是 非 

常 相似 的 ， 它 们 之 间 的 区 别 不 过 是 虚拟 机 栈 为 虚拟 机 执行 Java 方 法 

(也 惑 是 字 节 码 ) 服务 ， 而 本 地 方法 栈 则 为 虚拟 机 使 用 到 的 Native 方 
法 服务 。 在 虚拟 机 规范 中 对 本 地 方法 栈 中 方法 使 用 的 语言 、 使 用 方式 
与 数据 结构 并 没有 强制 规定 ， 因 此 具体 的 虚拟 机 可 以 自由 实现 它 。 其 
至 有 的 虚拟 机 (譬如 Sun HotSpot 虚 拟 机 ) 直接 就 把 本 地 方法 栈 和 虚拟 
机 栈 合 二 为 一 。 与 虚拟 机 栈 一 样 ， 本 地 方法 栈 区 域 也 会 抛 出 
StackOverflowError 和 OutOfMemoryError 有 异常 。 


2.2.4 Java 堆 


对 于 大 多 数 应 用 来 说 ，Java 堆 (Java Heap) 是 Java 虚 拟 机 所 管理 
的 内 存 中 最 大 的 一 块 。Java 堆 是 被 所 有 线程 共 至 的 一 块 内 存 区 域 ， 在 
虚拟 机 局 动 时 创建 。 此 内 存 区 域 的 唯一 目的 就 是 存放 对 象 实例 ， 几 乎 
所 有 的 对 象 实例 都 在 这 里 分 配 内 存 。 这 一 点 在 Java 虚 拟 机 规范 中 的 描 
述 是 : 所 有 的 对 象 实例 以 及 数组 都 要 在 堆 上 分 配 上 1， 但 是 随 着 JIT 编 译 
器 的 发 展 与 逃逸 分 析 技 术 逐 渐 成 熟 ， 栈 上 分 配 、 标 量 替 换 呈 优化 技术 
将 会 导致 一 些微 妙 的 变化 发 生 ， 所 有 的 对 象 都 分 配 在 堆 上 也 渐渐 变 得 
不 是 那么 “绝对 ”了 。 


Java 堆 是 垃圾 收集 器 管理 的 主要 区 域 ， 因 此 很 多 时 候 也 被 称 
做 “GC 堆 ” (Garbage Collected Heap， 幸 好 国内 没 翻 译 成 “垃圾 堆 ”) 。 
从 内 存 回 收 的 角度 来 看 ， 由 于 现在 收集 器 基本 都 采用 分 代 收 集 算法 ， 
所 以 Java 堆 中 还 可 以 细 分 为 : 新生 代 和 老年 代 ; 再 细致 一 点 的 有 Eden 
空间 、From Survivor 空 间 、To Survivor 空 间 等 。 从 内 存 分 配 的 角度 来 
看 ， 线 程 共享 的 Java 堆 中 可 能 划分 出 多 个 线程 私有 的 分 配 缓冲 区 
(Thread Local Allocation Buffer,TLAB) 。 不 过 无 论 如 何 划 分 ， 都 与 存 
放 内 容 无 关 ， 无 论 哪个 区 域 ， 存 储 的 都 仍然 是 对 象 实例 ， 进 一 步 划 分 
的 目的 是 为 了 更 好 地 回收 内 存 ， 或 者 更 快 地 分 配 内 存 。 在 本 章 中 ， 我 


们 仅仅 针对 内 存 区 域 的 作用 进行 讨论 ，Java 堆 中 的 上 述 各 个 区 域 的 分 


配 、 回 收 等 细节 将 是 第 3 章 的 主题 。 


根据 Java 虚 拟 机 规范 的 规定 ，Java 堆 可 以 处 于 物理 上 不 连续 的 内 
存 空间 中 ， 只 要 逻辑 上 是 连续 的 即 可 ， 整 像 我 们 的 磁盘 空间 一 样 。 在 
实现 时 ， 既 可 以 实现 成 国定 大 小 的 ， 也 可 以 是 可 扩展 的 ， 不 过 当前 主 
流 的 虚拟 机 都 是 按照 可 扩展 来 实现 的 (通过 -Xmx 和 -Xms 控 制 ， 。 如 
果 在 堆 中 没有 内 存 完成 实例 分 配 ， 并 且 扒 也 无 法 再 扩展 时 ， 将 会 抛 出 


OutOfMemoryError 异 常 。 


[lJJava 虚 拟 机 规范 中 的 原文 : The heap is the runtime data area from 
which memory for all class instances and arrays is allocated ° 


[2] 逃 逸 分 析 与 标量 蔡 换 的 相关 内 容 ， 参 见 第 11 章 相关 内 容 。 


.25 方 诗 区 


方法 区 〈Method Area) 与 Java 堆 一 样 ， 是 各 个 线程 共享 的 内 存 区 
域 , 它 用 于 存储 已 被 虚拟 机 加 载 的 类 信息 、 常 量 、 静 态 变 量 、 即 时 编 
译 器 编译 后 的 代码 等 数据 。 虽 然 Java 虚 拟 机 规范 把 方法 区 描述 为 堆 的 
一 个 逻辑 部 分 ， 但 是 它 却 有 一 个 别名 叫做 Non-Heap ( 非 堆 ) ， 目 的 应 
该 是 与 Java 堆 区 分 开 来 。 


对 于 习惯 在 HotSpot 虚 拟 机 上 开发 、 部 署 程序 的 开发 者 来 说 ， 很 多 
人 都 更 愿意 把 方法 区 称 为 “永久 代 ” (Permanent Generation) ， 本 质 上 
两 者 并 不 等 价 ， 仅 仅 是 因为 HotSpot 虚 拟 机 的 设计 团队 选择 把 GC 分 代 
收集 扩展 至 方法 区 ， 或 者 说 使 用 永久 代 来 实现 方法 区 而 已 ， 这 样 
HotSpot 的 垃圾 收集 器 可 以 像 管理 Java 堆 一 样 管理 这 部 分 内 存 ， 能 够 省 
去 专门 为 方法 区 编写 内 存 管理 代码 的 工作 。 对 于 其 他 虚拟 机 (如 BEA 
JRockit、IBM J9 等 ) 来 说 是 不 存在 永久 代 的 概念 的 。 原 则 上 ， 如 何 实 
现 方法 区 属于 虚拟 机 实现 细节 ， 不 受 虚 拟 机 规范 约束 ， 但 使 用 永久 代 
来 实现 方法 区 ， 现 在 看 来 并 不 是 一 个 好 主意 ， 因 为 这 样 更 容易 遇 到 内 
存 溢出 问题 (永久 代 有 -XX:MaxPermSize 的 上 限 ，J9 和 JRockit 只 要 没 
有 人 触 页 到 进程 可 用 内 存 的 上 限 ， 例 如 32 位 系统 中 的 4GB， 就 不 会 出 现 
问题 ) ， 而 且 有 极 少 数 方法 (例如 String.intern()) 会 因 这 个 原因 导致 
不 同 虚 拟 机 下 有 不 同 的 表现 。 因 此 ， 对 于 HotSpot 虚 拟 机 ， 根 据 官方 发 


布 的 路 线 图 信息 ， 现 在 也 有 放弃 永久 代 并 逐步 改 为 采用 Native Memory 
来 实现 方法 区 的 规划 了 山 ， 在 目前 已 经 发 布 的 JDK 1.7 的 HotSpot 中 ， 
已 经 把 原本 放 在 永久 代 的 字符 串 常量 池 移 出 。 


Java 虚 拟 机 规范 对 方法 区 的 限制 非常 宽松 ， 除 了 和 Java 扒 一 样 不 
需要 连续 的 内 存 和 可 以 选择 固定 大 小 或 者 可 扩展 外 ， 还 可 以 选择 不 实 
现 垃圾 收集 。 相 对 而 言 ， 垃 圾 收集 行为 在 这 个 区 域 是 比较 少 出 现 的 ， 
但 并 非 数 据 进 入 了 方法 区 束 如 永久 代 的 名 字 一 样 “ 永 久 ” 存 在 了 。 这 区 
域 的 内 存 回收 目标 主要 是 针对 第 量 池 的 回收 和 对 类 型 的 氏 载 ， 一 般 来 
说 ， 这 个 区 域 的 回收 “成 绩 ?比较 难以 令 人 满意 ， 尤 其 是 类 型 的 外 载 ， 
条 件 相 当 奇 刻 ， 但 是 这 部 分 区 域 的 回收 确实 是 必要 的 。 在 Sun 公 司 的 
BUG 列表 中 ， 曾 出 现 过 的 者 干 个 产 重 的 BUG 融 是 由 于 低 版 本 的 
HotSpot 虚 拟 机 对 此 区 域 未 完全 回收 而 导致 内 存 泄漏 。 


根据 Java 虚 拟 机 规范 的 规定 ， 当 方法 区 无 法 满足 内 存 分 配 需求 
上 时， 将 抛 出 OutOfMemoryError 异 常 。 


[1IJEP 122-Remove the Permanent Generation 


http://openjdk.java.net/jeps/122 ° 


2.2.6 ”运行 时 第 量 池 


运行 时 常量 池 (Runtime Constant Pool) 是 方法 区 的 一 部 分 。Class 
文件 中 除了 有 类 的 版 本 、 字 段 、 方 法 、 接 口 等 描述 信息 外 ， 还 有 一 项 
信息 是 常量 池 (Constant Pool Table) ， 用 于 存放 编译 期 生成 的 各 种 字 
面 量 和 符号 引用 ， 这 部 分 内 容 将 在 类 加 载 后 进入 方法 区 的 运行 时 常量 
池 中 存放 。 


Java 虚 拟 机 对 Class 文 件 每 一 部 分 (自然 也 包括 常量 池 ) 的 格式 都 
有 闫 格 规 定 ， 每 一 个 字 节 用 于 存储 哪 种 数据 都 必须 符合 规范 上 的 要 求 
会 侦 虚 拟 机 认可 、 流 载 和 执行 ， 但 对 于 运行 时 常量 池 ，Java 虚 拟 机 
规范 没有 做 任何 细节 的 要 求 ， 不 同 的 提供 商 实现 的 虚拟 机 可 以 按照 目 
己 的 需要 来 实现 这 个 内 存 区 域 。 不 过 ， 一 般 来 说 ， 除 了 保存 Class 文 件 
中 搬 述 的 符号 引用 外 ， 还 会 把 翻译 出 来 的 直接 引用 也 存储 在 运行 时 营 
量 池 中 国 。 


运行 时 常量 池 相 对 于 Class 文 件 第 量 池 的 男 外 一 个 重要 特征 是 具备 
动态 性 ，Java 语 言 并 不 要 求 弟 量 一 定 只 有 编译 期 才能 产生 ， 也 束 是 并 
非 预 置 入 Class 文 件 中 常量 池 的 内 容 才能 进入 方法 区 运行 时 常量 池 ， 运 
行 期 间 也 可 能 将 新 的 第 量 放 入 池 中 ， 这 种 特性 补 开 发 人 员 利 用 得 比较 
多 的 便 是 String 类 的 intern() 方 法 。 


既然 运行 时 常量 池 是 方法 区 的 一 部 分 ， 自 然 受 到 方法 区 内 存 的 限 
制 ， 当 常量 池 无 法 再 申请 到 内 存 时 会 抛 出 OutOfMemoryError 弄 第 。 


[1] 关 于 Class 文 件 格 式 和 符号 引用 等 概念 可 参见 第 6 章 。 


2.2.7 直接 内 存 


直接 内 存 (Direct Memory) 并 不 是 虚拟 机 运行 时 数据 区 的 一 部 
分 ， 也 不 是 Java 虚 拟 机 规范 中 定义 的 内 存 区 域 。 但 是 这 部 分 内 存 也 被 
频繁 地 使 用 ， 而 且 也 可 能 导致 OutOfMemoryError 异 常 出 现 ， 所 以 我 们 
放 到 这 里 一 起 讲解 。 


在 JDK 1.4 中 新 加 入 了 NIO (New Input/Output) 类 ， 引 入 了 一 种 基 
于 通道 (Channel) 与 缓冲 区 (Buffer) 的 IO 方式 ， 它 可 以 使 用 Native 
函数 库 直 接 分 配 堆 外 内 存 ， 然 后 通过 一 个 存储 在 Java 扒 中 的 
DirectByteBuffer 对 象 作 为 这 块 内 存 的 引用 进行 操作 。 这 样 能 在 一 些 场 
景 中 显著 提高 性 能 ， 因 为 避免 了 在 Java 推 和 Native 推 中 来 回复 制 数据 。 


显然 ， 本 机 直接 内 存 的 分 配 不 会 受到 Java 推 大 小 的 限制 ， 但 是 ， 
既然 是 内 存 ， 肯 定 还 是 会 受到 本 机 总 内 存 (包括 RAM 以 及 SWAP 区 或 
者 分 页 文件 ) 大 小 以 及 处 理 器 寻 扯 空间 的 限制 。 服 务 器 管理 员 在 配置 
虚拟 机 参数 时 ， 会 根据 实际 内 存 设 置 -Xmx 等 参数 信息 ， 但 经 名 忽略 直 
接 内 存 ， 使 得 各 个 内 存 区 域 总 和 大 于 物理 内 存 限制 (包括 物理 的 和 操 
作 系统 级 的 限制 ) ， 从 而 导致 动态 扩展 时 出 现 OutOfMemoryError 寞 


让 人 


吊 O 


2.3 HotSpot 虚 拟 机 对 象 探 秘 


介绍 完 Java 虚 拟 机 的 运行 时 数据 区 之 后 ， 我 们 大 致知 道 了 虚拟 机 
内 存 的 概况 ， 读 者 了 解 了 内 存 中 放 了 些 什么 后 ， 也 许 束 会 想 更 进一步 
了 解 这 些 虚 拟 机 内 存 中 的 数据 的 其 他 细节 ， 璧 如 它们 是 如 何 创建 、 如 
何 布局 以 及 如 何 访 问 的 。 对 于 这 样 涉 及 细 市 的 问题 ， 必 须 把 讨论 范围 
限定 在 具体 的 虚拟 机 和 集中 在 某 一 个 内 存 区 域 上 才 有 意义 。 基 于 实用 
优先 的 原则 ， 笔 者 以 滑 用 的 虚拟 机 HotSpot 和 稍 用 的 内 存 区 域 Java 堆 为 
例 ， 深 入 探讨 HotSpot 虚 拟 机 在 Java 扒 中 对 象 分 配 、 布 局 和 访问 的 全 过 
程 。 


2.3.1 对象 的 创建 


Java 是 一 门面 问 对 象 的 编程 语言 ， 在 Java 程 序 运 行 过 程 中 无 时 无 
刻 都 有 对 和 象 被 创建 出 来 。 在 语言 层面 上 ， 创 建 对 象 《例如 克隆 、 反 序 
列 化 ) 通常 仅仅 是 一 个 new 关 键 字 而 已 ， 而 在 虚拟 机 中 ， 对 象 (文中 
讨论 的 对 象限 于 普通 Java 对 象 ， 不 包括 数组 和 Class 对 象 等 ) 的 创建 又 


征 皇 样 一 个 过 程 呢 ? 


虚拟 机 中 到 一 条 new 指 令 时 ， 首 先 将 去 检查 这 个 指令 的 参数 是 否 


能 在 常量 池 中 定位 到 一 个 类 的 符号 引用 ， 并 且 检 查 这 个 符号 引用 代表 


的 类 是 否 已 被 加 载 、 解 析 和 初始 化 过 。 如 有 果 没 有 ， 那 必须 先 执行 相应 
的 类 加 载 过 程 ， 本 书 第 7 章 将 探讨 这 部 分 内 容 的 细 亡 。 


在 类 加 载 检查 通过 后 ， 接 下 来 虚拟 机 将 为 新 生 对 象 分 配 内 存 。 对 
象 所 需 内 存 的 大 小 在 类 加 载 完 成 后 便 可 完全 确定 如何 确定 将 在 2.3.2 
节 中 介绍 ) ， 为 对 象 分 配 空间 的 任务 等 同 于 把 一 块 确定 大 小 的 内 存 从 
Java 推 中 划分 出 来 。 假 设 Java 堆 中 内 存 是 绝对 规整 的 ， 所 有 用 过 的 内 
存 都 放 在 一 边 ， 空 朵 的 内 存放 在 另 一 边 ， 中 间 放 着 一 个 指针 作为 分 界 
点 的 指示 絮 ， 那 所 分 配 内 存 束 仅仅 是 把 那个 指针 向 空 几 空间 那 边 挪动 
一 段 与 对 象 大 小 相等 的 距离 ， 这 种 分 配方 式 称 为 “指针 磁 撞 ”(Bump 
the Pointer) 。 如 果 Java 堆 中 的 内 存 并 不 是 规整 的 ， 已 使 用 的 内 存 和 空 
闲 的 内 存 相 互 交错 ， 那 就 没有 办 法 简单 地 进行 指针 磁 撞 了 ， 虚 拟 机 束 
必须 维护 一 个 列表 ， 记 录 上 哪些 内 存 块 是 可 用 的 ， 在 分 配 的 时 候 从 列 
表 中 找到 一 块 足够 大 的 空间 划分 给 对 象 实例 ， 并 更 新 列表 上 的 记录 ， 
这 种 分 配方 式 称 为 “空闲 列表 ” (Free List) 。 选 择 哪 种 分 配方 式 由 Java 
堆 是 否 规整 决定 ， 而 Java 扒 是 否 规整 又 由 所 采用 的 垃圾 收集 器 是 否 带 
有 压缩 整理 功能 决定 。 因 此 ， 在 使 用 Serial、ParNew 等 带 Compact 过 程 
的 收集 器 时 ， 系 统 采用 的 分 配 算法 是 指针 碰撞 ， 而 使 用 CMS 这 种 基于 
Mark-Sweep 算 法 的 收集 器 时 ， 通 常 采 用 空闲 列表 。 


除 如 何 划 分 可 用 空间 之 外 ， 还 有 男 外 一 个 需要 考虑 的 问题 古 对 象 
创建 在 虚拟 机 中 是 非常 频繁 的 行为 ， 即 使 是 仅仅 修改 一 个 指针 所 指 同 


的 位 置 ， 在 并 发 情况 下 也 并 不 是 线程 安全 的 ， 可 能 出 现 正在 给 对 象 A 
分 配 内 存 ， 指 针 还 没 来 得 及 修改 ， 对 象 B 又 同时 使 用 了 原来 的 指针 来 
分 配 内 存 的 情况 。 解 决 这 个 问题 有 两 种 方案 ， 一 种 是 对 分 配 内 存 空 间 
的 动作 进行 同步 处 理 一 一 实际 上 虚拟 机 采用 CAS 配 上 失败 重 试 的 方式 
保证 更 新 操作 的 原子 性 ;， 另 一 种 是 把 内 存 分 配 的 动作 按照 线程 划分 在 
不 同 的 空间 之 中 进行 ， 即 每 个 线程 在 Java 堆 中 预先 分 配 一 小 块 内 存 ， 
称 为 本 地 线程 分 配 缓冲 (Thread Local Allocation Buffer,TLAB) 。 哪 个 
线程 要 分 配 内 存 ， 就 在 哪个 线程 的 TLAB 上 分 配 ， 只 有 TLAB 用 完 并 分 
配 新 的 TLAB 时 ， 才 需要 同步 锁定 。 虚 拟 机 是 否 使 用 TLAB， 可 以 通 
过 -XX:+/-UseTLAB 参 数 来 设 定 。 


内 存 分 配 完 成 后 ， 虚 拟 机 需要 将 分 配 到 的 内 存 空 间 都 初始 化 为 堆 
值 〈 不 包括 对 象 头 ) ， 如 果 使 用 TLAB， 这 一 工作 过 程 也 可 以 提前 至 
TLAB 分 配 时 进行 。 这 一 步 操作 保证 了 对 象 的 实例 字段 在 Java 代 码 中 可 
以 不 赋 初 始 值 就 直接 使 用 ， 程 序 能 访问 到 这 些 字段 的 数据 类 型 所 对 应 
的 零 值 。 


接 下 来 ， 虚 拟 机 要 对 对 象 进行 必要 的 设置 ， 例 如 这 个 对 象 是 哪个 
类 的 实例 、 如 何 才能 找到 类 的 元 数据 信息 、 对 象 的 哈 布 码 、 对 象 的 GC 
分 代 年 龄 等 信息 。 这 些 信息 存放 在 对 象 的 对 象 头 《Object Header) 之 
中 。 根 据 虚 拟 机 当前 的 运行 状态 的 不 同 ， 如 是 否 局 用 偏向 锁 等 ， 对 和 象 


头 会 有 不 同 的 设置 方式 。 关 于 对 象 头 的 具体 内 容 ， 稍 后 再 做 详细 介 


绍 。 


在 上 面 工作 都 完成 之 后 ， 从 虚拟 机 的 视角 来 看 ， 一 个 新 的 对 象 已 
经 产生 了 ， 但 从 Java 程 序 的 视角 来 看 ， 对 和 象 创建 才刚 刚 开始 
> 方法 还 没有 执行 ， 所 有 的 字段 都 还 为 零 。 所 以 ， 一 般 来 说 (由 字 证 
码 中 是 否 跟 随 invokespecial 指 令 所 决定 ) ， 执 行 new 指 令 之 后 会 接着 执 
行 <init> 方 法 ， 把 对 象 按照 程序 员 的 意愿 进行 初始 化 ， 这 样 一 个 真正 
可 用 的 对 象 才 算 完 全 产生 出 来 。 


< init 


下 面 的 代码 请 单 2-1 是 HotSpot 虚 拟 机 bytecodeInterpretercpp 中 的 代 
码 片段 〈《 这 个 解释 器 实现 很 少 有 机 会 实际 使 用 ， 因 为 大 部 分 平台 上 都 
使 用 模板 解释 器 ; 当代 码 通过 JIT 编 译 器 执行 时 差异 就 更 大 了 “。 不 过 ， 
这 段 代 码 用 于 了 解 HotSpot 的 运作 过 程 是 没有 什么 问题 的 ) 。 


代码 清单 2-1 HotSpot 解 释 器 的 代码 片段 


// 确 保 彰 量 池 中 存放 的 是 已 解释 的 类 

if (!constants->tag_at (index) .is_unresolved klass()) { 

// 断 言 确 保 是 klass0op 和 instanceKLlass0op (这 部 分 下 一 节 介 绍 ) 

oop entry= (klass0op) *constants- >obj_at_addr (index) ; 

assert (entry->is klass(), "Should be resolved klass") ; 

klassoop k_entry= (klass0op) entry:; 

assert (k_entry->klass part()->oop_is instance(), "Should be 
instanceKlass" 

instanceKlass * ik= (instanceKlass*) k_entry->klass_part(); 

// 确 保 对 象 所 属 类 型 已 经 经 过 初始 化 阶段 

if (ik->is initialized()&&ik->can be fastpath allocated()) 


{ 
// 取 对 象 长 度 


size_t ob]j]_ size=ik->size _ helper():; 
oop result=NULL:; 

// 记 录 是 否 需 要 将 对 象 所 有 字段 置 零 值 
bool need zero=!ZeroTLAB; 

// 是 否 在 TLAB 中 分 配对 象 


if (UseTLAB 
result= (oo0p) THREAD->tlab().allocate (obj size) ; 
} 


if (result==NULL) { 

need_zero=true; 

// 直 接 在 eden 中 分 配对 象 

retry: 

Heapword * compare_ to=*Universe:heap()->top_addr(); 

HeapWord * new_top=compare_to+obj_size.; 

/*cmpxchg 是 x86 中 的 CAS 指 令 ， 这 里 是 一 个 C++ 方法 ， 通 过 CAS 方 式 分 配 空间 ， 如 果 并 
发 失败 ， 

转 到 retry 中 重 试 ， 直 至 成 功 分 配 为 上 */ 

if (new_ top<=*Universe:heap()->end addr()) { 

if (Atomic:cmpxchg_ptr (new_top,Universe:heap()->top_addr(), 
compare_to) !=compare to) { 


goto retry; 

} 

result= (00p) compare_to; 
} 


} 

if (result!=NULL) { 

// 如 果 需 要 ， 则 为 对 象 初始 化 零 值 
if (need zero) { 

HeapWord * to zero= (HeapWord*) result+sizeof (oopDesc) /oo0pSize.; 
obj_size-=sizeof (oopDesc) /oo0pSize; 

if (obj_size>0) { 

memset (to_zero, 0, obj_size * HeapwordSize) : 

} 

} 

// 根 据 是 否 启用 偏向 锁 来 设置 对 象 头 信息 
if (UseBiasedLocking) { 
result->set mark (ik->prototype_header()) ; 
}elsef{ 

result->set mark (markOopDesc:prototype()); 
} 

result->set klass gap (0); 

result->set_ klass (k_entry) ; 

// 将 对 象 引 用 入 栈 ， 继 续 执 行 下 一 条 指令 
SET_STACK_OBJECT (result, 0); 
UPDATE_PC_AND_TOS_AND_CONTINUE (3，1) ; 

和 


Cy 


2.3.2” ”对象 的 内 存 布局 


在 HotSpot 虚 拟 机 中 ， 对 象 在 内 存 中 存储 的 布局 可 以 分 为 3 块 区 域 : 
对 象 头 (Header) 、 实 例 数据 (Instance Data) 和 对 齐 填充 
(Padding) 。 


HotSpot 虚 拟 机 的 对 象 头 包括 两 部 分 信息 ， 第 一 部 分 用 于 存储 对 象 
自身 的 运行 时 数据 ， 如 哈 希 码 (HashCode) 、GC 分 代 年 龄 、 锁 状态 标 

` 线程 持 有 的 锁 、 偏 向 线程 ID、 偏 向 时 间 惟 等 ， 这 部 分 数据 的 长 度 
在 32 位 和 64 位 的 虚拟 机 (未 开启 压缩 指针 ) 中 分 别 为 32bit 和 64bit， 官 
方 称 它 为 "Mark Word"。 对 象 需要 存储 的 运行 时 数据 很 多 ， 其 实 已 经 超 
出 了 32 位 、64 位 Bitmap 结 构 所 能 记录 的 限度 ， 但 是 对 象 头 信息 是 与 对 
象 自身 定义 的 数据 无 关 的 额外 存储 成 本 ， 考 虑 到 虚拟 机 的 空间 效率 ， 
Mark Word 被 设计 成 一 个 非 国定 的 数据 结构 以 便 在 极 小 的 空间 内 存储 尽 
量 多 的 信息 ， 它 会 根据 对 象 的 状态 复 用 自己 的 存储 空间 。 例 如 ， 在 32 
位 的 HotSpot 虚 拟 机 中 ， 如 果 对 象 处 于 未 被 锁定 的 状态 下 ， 那 么 Mark 
Word 的 32bit 空 间 中 的 25bit 用 于 存储 对 象 哈 希 码 ，4bit 用 于 存储 对 象 分 代 
年 龄 ，2bit 用 于 存储 锁 标志 位 ，1lbit 固 定 为 0， 而 在 其 他 状态 ( 轻 量 级 锁 
定 、 重 量 级 锁定 、GC 标 记 、 可 偏向 ) 下 对 象 的 存储 内 容 见 表 2-1。 


表 2-1 HotSpot 虚拟 机 对 象 头 Mark Word 


存储 内 容 标 志 位 状 态 
对 象 哈 希 码 、 对 象 分 代 年 龄 01 未 锁定 
指向 锁 记 录 的 指针 00 轻 量 级 锁定 
指向 重量 级 锁 的 指针 10 膨胀 〈 重 量 级 锁定 ) 
空 ， 不 需要 记录 信息 11 GC 标记 
偏向 线程 [D、 偏 向 时 间 蕉 、 对 象 分 代 年 龄 01 可 偏向 


对 象 头 的 男 外 一 部 分 是 类 型 指针 ， 即 对 和 象 指向 它 的 类 元 数据 的 指 
针 ， 虚 拟 机 通过 这 个 指针 来 确定 这 个 对 象征 哪个 类 的 实例 。 并 不 是 所 
有 的 虚拟 机 实现 都 必须 在 对 象 数据 上 保留 类 型 指针 ， 换 句 话 说， 查找 
对 象 的 元 数据 信息 并 不 一 定 要 经 过 对 象 本 喘 ， 这 点 将 在 2.3.3 节 讨论 。 
另外 ， 如 果 对 象 是 一 个 Java 数 组 ， 那 在 对 象 头 中 还 必须 有 一 块 用 于 记录 
数组 长 度 的 数据 ， 因 为 虚拟 机 可 以 通过 普通 Java 对 象 的 元 数据 信息 确定 
Java 对 象 的 大 小 ， 但 是 从 数组 的 元 数据 中 却 无 法 确定 数组 的 大 小 。 


代码 清单 2-2 为 HotSpot 虚 拟 机 markOop.cpp 中 的 代码 (注释 ) 片 
段 ， 它 描述 了 32bit 下 Mark Word 的 存储 状态 。 


代码 清单 2-2 ”markOop.cpp 片 段 


//Bit-format of an object header (most significant first,big 
endian layout below) : 
//32 bits: 


//hash:25------------ >|age:4 biased lock:1 lock:2 (normal 
object) 

//JavaThread*:23 epoch:2 age:4 biased lock:1 lock:2 (biased 
object) 

//Size:32----- >| (CMS free 
block) 


//PromotedObject*:29---------- > |promo_bits:3----- >| (CMS 
promoted object) 


接 下 来 的 实例 数据 部 分 是 对 象 真正 存储 的 有 效 信息 ， 也 是 在 程序 
代码 中 所 定义 的 各 种 类 型 的 字段 内 容 。 无 论 是 从 父 类 继承 下 来 的 ， 还 
是 在 子 类 中 定义 的 ， 都 需要 记录 起 来 。 这 部 分 的 存储 顺序 会 受到 虚拟 
机 分 配 策略 参数 (FieldsAllocationStyle) 和 字段 在 Java 源 码 中 定义 顺序 
的 影响 。HotSpot 虚 拟 机 默认 的 分 配 策略 为 longs/doubles、ints、 
shorts/chars、bytes/booleans、oops (Ordinary Object Pointers) ， 从 分 配 
策略 中 可 以 看 出 ， 相 同 宽度 的 字段 总 是 被 分 配 到 一 起 。 在 满足 这 个 前 
提 条 件 的 情况 下 ， 在 父 类 中 定义 的 变量 会 出 现在 子 类 之 前 。 如 果 
CompactFields 参 数值 为 tue (默认 为 ttue) ， 那 么 子 类 之 中 较 罕 的 变量 
也 可 能 会 插入 到 父 类 变量 的 空 际 之 中 。 


第 三 部 分 对 齐 填充 并 不 是 必然 存在 的 ， 也 没有 特别 的 含义 ， 它 仅 
仅 起 着 占 位 符 的 作用 。 由 于 HotSpot VM 的 自动 内 存 管理 系统 要 求 对 象 
起 始 地 址 必须 是 8 字 市 的 整数 倍 ， 换 句 话说 ， 就 是 对 象 的 大 小 必须 是 8 
字 市 的 整数 倍 。 而 对 象 头 部 分 正好 是 8 字 市 的 倍数 (1 倍 或 者 2 倍 ) ， 
此 ， 当 对 象 实例 数据 部 分 没有 对 齐 时 ， 就 需要 通过 对 齐 填充 来 补 全 。 


2.3.3 对象 的 访问 定位 


建立 对 象 是 为 了 使 用 对 象 ， 我 们 的 Java 程 序 需要 通过 栈 上 的 
reference 数 据 来 操作 堆 上 的 具体 对 象 。 由 于 reference 类 型 在 Java 虚 拟 机 
规范 中 只 规定 了 一 个 指向 对 象 的 引用 ， 并 没有 定义 这 个 引用 应 该 通过 
何 种 方式 去 定位 、 访 问 挫 中 的 对 象 的 具体 位 置 ， 所 以 对 象 访问 方式 也 
征 取 决 于 虚拟 机 实现 而 定 的 。 目 前 主流 的 访问 方式 有 使 用 句柄 和 直接 
指针 两 种 。 

如 果 使 用 句柄 访问 的 话 ， 那 么 Java 推 中 将 会 划分 出 一 块 内 存 来 作为 


句柄 池 ，reference 中 存储 的 就 是 对 象 的 句柄 地 址 ， 而 句柄 中 包含 了 对 象 
实例 数据 与 类 型 数据 各 上 自 的 具体 地 址 信息 ， 如 图 2-2 所 示 。 
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图 2-2 通过 句柄 访问 对 象 


如 果 使 用 直接 指针 访问 ， 那 么 Java 堆 对 象 的 布局 中 就 必须 考虑 如 何 
放置 访问 类 型 数据 的 相关 信息 ， 而 reference 中 存储 的 直接 就 是 对 象 地 
址 ， 如 图 2-3 所 示 。 


Java 栈 


本 地 变量 表 
nt 到 对 象 类 型 数据 的 指针 
wb 对 象 实例 数据 
referen 
int 
| |») [hE Sp 方法 区 


float 
a 对 象 类 型 数据 


图 2-3 通过 直接 指针 访问 对 象 


这 两 种 对 象 访问 方式 各 有 优势 ， 使 用 句柄 来 访问 的 最 大 好 处 束 是 
reference 中 存储 的 是 稳定 的 句柄 地 址 ， 在 对 象 被 移动 (垃圾 收集 时 移动 
对 象 是 非常 普遍 的 行为 ) 时 只 会 改变 句柄 中 的 实例 数据 指针 ， 而 
reference 本 身 不 需要 修改 。 


使 用 直接 指针 访问 方式 的 最 大 好 处 束 是 速度 更 快 ， 它 市 省 了 一 次 
指针 定位 的 时 间 开 销 ， 由 于 对 象 的 访问 在 Java 中 非 第 频 替 ， 因 此 这 类 开 
销 积 少 成 多 后 也 是 一 项 非常 可 观 的 执行 成 本 。 束 本 书 讨论 的 主要 虚拟 
机 Sun HotSpot 而 言 ， 它 是 使 用 第 二 种 方式 进行 对 象 访问 的 ， 但 从 整个 


软件 开发 的 范围 来 看 ， 各 种 语言 和 框 殿 使 用 句柄 来 访问 的 情况 也 十 分 


常见 。 


2.4 ”实战 ，OutOfMemoryError 异 常 


在 Java 虚 拟 机 规范 的 描述 中 ， 除 了 程序 计数 姻 外， 虚拟 机 内 存 的 其 
他 几 个 运行 时 区 域 都 有 发 生 OutOfMemoryError (下 文 称 OOM) 异常 的 
可 能 ， 本 节 将 通过 若干 实例 来 验证 异常 发 生 的 场景 〈 代 码 清单 2-3~ 代 码 
清单 2-9 的 几 段 商 单 代 码 ) ， 并 且 会 初步 介绍 几 个 与 内 存 相 关 的 最 基本 
的 虚拟 机 参数 。 


本 市 内 容 的 目的 有 两 个 : 第 一 ， 通 过 代码 验证 Java 虚 拟 机 规范 中 摘 
述 的 各 个 运行 时 区 域 存储 的 内 容 ; 第 二 ， 布 望 读者 在 工作 中 遇 到 实际 
的 内 存 洲 出 异 第 时 ， 能 根据 异 单 的 信息 快速 判断 是 哪个 区 域 的 内 存 泡 
出 ， 知 道 什么 样 的 代码 可 能 会 导致 这 些 区 域内 存 次 出， 以 及 出 现 这 些 
异 音 后 该 如 何 处 理 。 


下 文 代码 的 开头 都 注释 了 执行 时 所 需要 设置 的 虚拟 机 启动 参数 
(注释 中 "VM Args" 后 面 跟着 的 参数 ) ， 这 些 参数 对 实验 的 结果 有 直接 
影响 ， 读 者 调试 代码 的 时 候 千 万 不 要 和 忽略。 如果 读者 使 用 控制 台 命令 
来 执行 程序 ， 那 直接 跟 在 Java 命 令 之 后 书写 就 可 以 。 如 果 读者 使 用 
Eclipse IDE， 则 可 以 参考 图 2-4 在 Debug/Run 页 签 中 的 设置 。 
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图 2-4 在 Eclipse 的 Debug 页 签 中 设置 虚拟 机 参数 


下 文 的 代码 都 是 基于 Sun 公 司 的 HotSpot 虚 拟 机 运行 的 ， 对 于 不 同 
公司 的 不 同 版 本 的 虚拟 机 ， 参 数 和 程序 运行 的 结果 可 能 会 有 所 差别 。 


2.4.1 Java 堆 溢出 


Java 堆 用 于 存储 对 象 实例 ， 只 要 不 断 地 创建 对 象 ， 并 且 保 证 GC 
Roots 到 对 象 之 间 有 可 达 路 径 来 避免 垃圾 回收 机 制 清除 这 些 对 象 ， 那 么 
在 对 象 数量 到 达 最 大 扒 的 容量 限制 后 吏 会 产生 内 存 盗 出 异 和 。 


代码 清单 2-3 中 代码 限制 Java 堆 的 大 小 为 20MB， 不 可 扩展 (将 堆 的 
最 小 值 -Xms 参 数 与 最 大 值 -Xmx 参 数 设 置 为 一 样 即 可 避免 堆 目 动 扩 
展 ) ， 通 过 参数 -XX:+HeapDumpOnOutOfMemoryError 可 以 让 虚拟 机 在 
出 现 内 存 淤 出 异常 时 Dump 出 当前 的 内 存 堆 转 储 快照 以 便 事后 进行 分 析 
[1] 。 


代码 清单 2-3 ”Java 堆 内 存 次 出 异 第 测试 


/** 

*VM Args:-Xms20m-Xmx20m-XX:+HeapDumponoutofMemoryError 
*@author zzm 

*/ 

public class HeapOOM{ 

static class OOMObject{ 


public static void main (String[]args) { 
List<OOMObject>1ist=new ArrayList<0O0OMobject> (); 
while (true) { 


list.add (new OOMObject()); 
} 


} 


运行 结 采 : 


java.1lang.OutofMemoryError:Java heap Space 
Dumping heap to java pid3404.hprof...... 
Heap dump file created[22045981 bytes in 0.663 Secs] 


Java 堆 内 存 的 OOM 异 常 是 实际 应 用 中 常见 的 内 存 洲 出 异常 情况 。 
当 出 现 Java 堆 内 存 洪 出 时 ， 异 常 堆栈 信 


息 "java.lang.OutOfMemoryError" 会 跟着 进一步 提示 "Java heap space"。 


要 解决 这 个 区 域 的 异常 ， 一 般 的 手段 症 先 通过 内 存 映像 分 析 工 具 
(如 Eclipse Memory Analyzer) 对 Dump 出 来 的 堆 转 储 快 照 进行 分 析 ， 
重点 是 确认 内 存 中 的 对 象 是 否 是 必要 的 ， 也 就 是 要 先 分 清楚 到 讨 是 出 
现 了 内 存 泄漏 (Memory Leak) 还 是 内 存 洪 出 (Memory Overflow) 。 
图 2-5 显 示 了 使 用 Eclipse Memory Analyzer 打 开 的 堆 转 储 快照 文件 。 
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图 2-5 使 用 Eclipse Memory Analyzer 打 开 的 堆 转 储 快照 文件 


如 有 果 是 内 存 泄 露 ， 可 进一步 通过 工具 查看 泄露 对 象 到 GC Roots 的 
引用 链 。 于 十 就 能 找到 泄露 对 象 是 通过 怎样 的 路 径 与 GC Roots 相 关联 
并 导致 垃圾 收集 禹 无 法 目 动 回收 它们 的 。 千 握 了 证 露 对 象 的 类 型 信息 
及 GC Roots 引 用 链 的 信息 ， 束 可 以 比较 准确 地 定位 出 泄露 代码 的 位 
= 


如 采 不 存在 泄露 ， 换 句 话 说 ， 就 是 内 存 中 的 对 象 确 实 都 还 必须 存 
活着 ， 那 就 应 当 检 查 虚 拟 机 的 堆 参 数 (-Xmx 与 -Xms) ， 与 机 器 物理 内 
存 对 比 看 是 否 还 可 以 调 大 ， 从 代码 上 检查 是 否 存在 某 些 对 和 象 生命 周期 
过 长 、 持 有 状态 时 间 过 长 的 情况 ， 壬 试 减少 程序 运行 期 的 内 存 消 耗 。 


以 上 是 处 理 Java 堆 内 存 问题 的 简单 思路 ， 处 理 这 些 问 题 所 需要 的 知 


识 、 工 具 与 经 验 是 后 面 3 章 的 主题 。 


[1] 关 于 堆 转 储 快照 文件 分 析 方 面 的 内 容 ， 可 参见 第 4 章 。 


2.4.2 ”虚拟 机 栈 和 本 地 方法 栈 次 出 


由 于 在 HotSpot 虚 拟 机 中 并 不 区 分 虚拟 机 栈 和 本 地 方法 栈 ， 因 此 ， 
对 于 HotSpot 来 说 ， 昌 然 -Xoss 参 数 (设置 本 地 方法 栈 大 小 ) 存在 ,但 
实际 上 有 是 无 效 的 ， 栈 容量 只 由 -Xss 参 数 设 定 。 关 于 虚拟 机 栈 和 本 地 方 
法 栈 ， 在 Java 虚 拟 机 规范 中 摘 述 了 两 种 寞 币 : 


如 果 线 程 请 求 的 栈 深度 大 于 虚拟 机 所 允许 的 最 大 深度 ， 将 抛 出 


StackOverflowError 异 常 。 


如 果 虚 拟 机 在 扩展 栈 时 无 法 申请 到 足够 的 内 存 空间 ， 则 抛 出 


OutOfMemoryError 异 常 。 


这 里 把 异 稼 分 成 两 种 情况 ， 看 似 更 加 斑 诞 ， 但 却 存在 着 一 些 互相 
重合 的 地 方 ， 当 栈 空间 无 法 继续 分 配 时 ， 到 说 是 内 存 太 小 ， 还 十 已 使 
用 的 栈 空 间 太 大 ， 其 本 质 上 只 是 对 同一 件 事 情 的 两 种 描述 而 已 。 


在 笔者 的 实验 中 ， 将 实验 范围 限制 于 单线 程 中 的 操作 ， 壬 试 了 下 
面 两 种 方法 均 无 法 让 虚拟 机 产生 OutOfMemoryError 异 常 ， 演 试 的 结 
都 是 获得 StackOverflowError 寞 常 ， 测 试 代码 如 代码 清单 2-4 所 示 。 


使 用 -Xss 参 数 减 少 栈 内 存 容量 。 结 果 : 抛 出 StackOverflowError 异 
党， 异 浓 出 现时 输出 的 堆栈 深度 相应 缩小 。 


定义 了 大 量 的 本 地 变量 ， 增 大 此 方法 帧 中 本 地 变量 表 的 长 度 。 结 
果 : 抛 出 StackOverflowError 异 党 时 输出 的 堆栈 深度 相应 缩小 。 


代码 清单 2-4 虚拟 机 栈 和 本 地 方法 栈 OOM 测 试 〈 仅 作为 第 1 点 测 
试 程序 ) 


人 

*VM Args:-Xss128k 

*@author zzm 

*/ 

public class JavaVMStackSOF{ 

private int stackLength=1; 

public void stackLeak(){ 

StackLength++; 

stackLeak( ) ; 

} 

public static void main (String[]args) throws Throwable{ 
JavaVMStackSOF oom=new JavaVMStackSOF(); 

try{ 

oom. stackLeak( ); 

}catch (Throwable e) { 

System.out.println ("stack length:"+oom.stackLength) : 
throw e; 


stack length:2402 

Exception in thread"main"java.lang.StackOverflowError 

at org.fenixsoft.oom.VMStackSOF.1leak (VMStackSOF.java:20) 
at org.fenixsoft.oom.VMStackSOF.1leak (VMStackSOF.java:21) 
at org.fenixsoft.oom.VMStackSOF.1leak (VMStackSOF.java:21) 
a 后 续 异 常 堆栈 信息 省 略 


实验 结 末 表明 : 在 单个 线程 下 ， 无 论 是 由 于 栈 帧 太 大 还 是 虚拟 机 
栈 容 量 太 小 ， 当 内 存 无 法 分 配 的 时 候 ， 虚 拟 机 抛 出 的 都 是 


StackOverflowError 异 和 常 。 


如 果 测 试 时 不 限于 单线 程 ， 通 过 不 断 地 建立 线程 的 方式 倒是 可 以 
产生 内 存 溢出 异常 ， 如 代码 清单 2-5 所 示 。 但 是 这 样 产 生 的 内 存 淤 出 异 
常 与 栈 空间 是 否 足 够 大 并 不 存在 任何 联系 ， 或 者 准确 地 说 ， 在 这 种 情 
况 下 ， 为 每 个 线程 的 栈 分 配 的 内 存 越 大 ， 反 而 越 容易 产生 内 存 洲 出 异 


= 


吊 O 


其 实 原因 不 难 理解 ， 操 作 系统 分 配给 每 个 进程 的 内 存 症 有 限制 
的 ， 壁 如 32 位 的 Windows 限 制 为 2GB。 虚 拟 机 提供 了 参数 来 控制 Java 堆 
和 方法 区 的 这 两 部 分 内 存 的 最 大 值 。 剩 余 的 内 存 为 2GB (操作 系统 限 
制 ) 减 去 xmx (最 大 堆 容量 ) ， 再 减 去 MaxPermSize (最 大 方法 区 容 
量 ) ， 程 序 计数 器 消耗 内 存 很 小 ， 可 以 忽略 掉 。 如 采 虚 拟 机 进程 本 身 
耗费 的 内 存 不 计算 在 内 ， 剩 下 的 内 存 殉 由 虚拟 机 栈 和 本 地 方法 栈 “ 扑 
分 ”* 了 。 每 个 线程 分 配 到 的 栈 容量 越 大 ， 可 以 建立 的 线程 数量 自然 束 越 
少 ， 建 立 线程 时 束 越 容易 把 剩 下 的 内 存 耗 尽 。 


这 一 点 读者 需要 在 开发 多 线程 的 应 用 时 特别 注意 ， 出 现 
StackOverflowError 异 彰 时 有 错误 堆栈 可 以 阅读 ， 相 对 来 说 ， 比 较 容 易 
找到 问题 的 所 在 。 而 且 ， 如 果 使 用 虚拟 机 上 默认 参数 ， 栈 深度 在 大 多 数 
情况 下 〈 因 为 每 个 方法 压 入 栈 的 帧 大 小 并 不 是 一 样 的 ， 所 以 只 能 说 在 


大 多 数 情况 下 ) 达到 1000~2000 完 全 没有 问题 ， 对 于 正常 的 方法 调用 

(包括 递归 ) ， 这 个 深度 应 该 完全 够 用 了 。 但 是 ， 如 果 是 建立 过 多 线 
程 导致 的 内 存 溢 出 ， 在 不 能 减少 线程 数 或 者 更 换 64 位 虚拟 机 的 情况 
下 ， 就 只 能 通过 减少 最 大 堆 和 减少 栈 容量 来 换取 更 多 的 线程 。 如 果 没 
有 这 方面 的 处 理 经 验 ， 这 种 通过 “减少 内 存 ” 的 手段 来 解决 内 存 洪 出 的 
方式 会 比较 难以 想到 。 


代码 清单 2-5 ”创建 线程 导致 内 存 洲 出 异常 


yA 

*VYM Args:-Xss2M (这 时 候 不 妨 设置 大 些 ) 
*Q@author zzm 

*/ 

public class JavaVMStackOOMT 
private void dontStop(){ 

while (true) { 

} 


} 

public void stackLeakByThread(){ 

while (true) { 

Thread thread=new Thread (new Runnable(){ 
Q@Override 

public void run(){ 

dontStop( ); 


}) ; 
thread. start(); 


} 


public static void main (String[]args) throws Throwable{ 
JavaVMStackOOM oom=new JavaVMStackOOM(); 

oom, StackLeakByThread( ); 

} 

} 


注意 ”特别 提示 一 下 ， 如 果 读 者 要 竹 试 运行 上 面 这 段 代码 ， 记 得 
要 先 保存 当前 的 工作 。 由 于 在 Windows 平 台 的 虚拟 机 中 ，Java 的 线程 
是 映射 到 操作 系统 的 内 核 线 程 上 的 由， 因此 上 述 代 码 执 行 时 有 较 大 的 
风险 ， 可 能 会 导致 操作 系统 假死 。 


运行 结 采 : 


Exception in thread"main"java.lang.OutofMemoryError:unable to 
create new native thread 


[关于 虚拟 机 线程 实现 方面 的 内 容 可 以 参考 本 书 第 12 章 。 


2.4.3 “方法 区 和 运行 时 向 量 池 注 出 


由 于 运行 时 常量 池 古 方法 区 的 一 部 分 ， 因 此 这 两 个 区 域 的 次 出 测 
试 就 放 在 一 起 进行 。 前 面 提 到 JDK 1.7 开 始 逐 步 “ 去 永久 代 ” 的 事情 ， 在 
此 束 以 测试 代码 观察 一 下 这 件 事 对 程序 的 实际 影响 。 


String.intern0 是 一 个 Native 方 法 ， 它 的 作用 是 : 如果 字符 串 常 量 池 
中 已 经 包含 一 个 等 于 此 String 对 象 的 字符 串 ， 则 返回 代表 池 中 这 个 字符 
串 的 String 对 象 ， 和 否则 ， 将 此 String 对 象 包含 的 字符 串 添 加 到 常量 池 
中 ， 并 且 返 回 此 String 对 象 的 引用 。 在 JDK 1.6 及 之 前 的 版 本 中 ， 由 于 
也 分 配 在 永久 代 内 ， 我 们 可 以 通过 -XX:PermSize 和 - 
XX:MaxPermSize 限 制 方法 区 大 小 ， 从 而 间接 限制 其 中 常量 池 的 容量 ， 
如 代码 清单 2-6 所 示 。 


代码 清单 2.6 ”运行 时 常量 池 导 致 的 内 存 溢出 异常 


/A 

*VM Args:-XX:PermSize=10M-XX:MaxPermSize=10OM 
*@author zzm 

2 

public class RuntimeConstantPoolOOMT{ 

public static void main (String[]args) { 

// 使 用 List 保 持 着 常量 池 引 用 ， 避 免 Ful1l GC 回收 常量 池 行 为 
List<String>1ist=new ArrayList<String> (); 
//10MB 的 PermSize 在 integer 范 围 内 足够 产生 00M 了 
int i=0; 

while (true) { 

list.add (String.valueof (i++) .intern()); 

} 


ES] 


运行 结果 : 


Exception in thread"main"java.lang.OutofMemoryError:PermGen 
Space 
at java.lang.String.intern (Native Method) 
at org.fenixsoft.oom.RuntimeConstantPoolOOM.main 
(RuntimeCconstantPoo100M. java:18) 


从 运行 结果 中 可 以 看 到 ， 运 行 时 常量 池 洪 出 ， 在 
OutOfMemoryError 后 面 跟随 的 提示 信息 是 "PermGen space"， 说 明 运 行 
时 常量 池 属 于 方法 区 (HotSpot 虚 拟 机 中 的 永久 代 ) 的 一 部 分 


而 使 用 JDK 1.7 运 行 这 段 程序 就 不 会 得 到 相同 的 结果 ，while 循 环 
将 一 直 进 行 下 去 。 关 于 这 个 字符 串 常量 池 的 实现 问题 ， 还 可 以 引申 出 
一 个 更 有 意思 的 影响 ， 如 代码 清单 2-7 所 示 < 


代码 清单 2-7 ”String.intern(0) 返 回 引 用 的 测试 


public class RuntimeConstantPoolOOMT{ 

public static void main (String[]jargs) { 

public static void main (String[]args) { 

String str1=new StringBuilder ("计算 机 ") .append (" 软 
件 ") ,toString(); 

System.out.println (str1i,.intern()==str1) ; 

String str2=new StringBuilder ("ja") .append ("va") .toString(); 

System.out.println (str2.intern()==str2) ; 

} 

} 

} 


这 段 代码 在 JDK 1.6 中 运行 ， 会 得 到 两 个 false， 而 在 JDK 1.7 中 运 
行 ， 会 得 到 一 个 true 和 一 个 false。 产生 差异 的 原因 是 ， 在 JDK 1.6 中 ， 
intern() 方 法 会 把 首次 遇 到 的 字符 串 实 例 复制 到 永久 代 中 ， 返 回 的 也 是 
永久 代 中 这 个 字符 串 实 例 的 引用 ， 而 由 StringBuilder 创 建 的 字符 串 实例 
在 Java 堆 上 ， 所 以 必然 不 是 同一 个 引用 ， 将 返回 false。 而 JDK 1.7 (以 
及 部 分 其 他 虚拟 机 ， 例 如 JRockit) 的 intern0 实 现 不 会 再 复制 实例 ， 只 
是 在 常量 池 中 记录 首次 出 现 的 实例 引用 ， 因 此 intern() 返 回 的 引用 和 由 
StringBuilder 创 建 的 那个 字符 串 实例 是 同一 个 。 对 str2 比 较 返 回 false 是 
为 "java" 这 个 字符 串 在 执行 StringBuilder.toString() 之 前 已 经 出 现 过 ， 
字符 串 常量 池 中 已经 有 它 的 引用 了 ， 不 符合 “首次 出 现 * 的 原则 ， 而 “ 计 
算 机 软件 ”这 个 字符 串 则 是 下 次 出 现 的 ， 因 此 返回 true。 


方法 区 用 于 存放 Class 的 相关 信息 ， 如 类 名 、 访 问 修 饰 符 、 常 量 
池 、 字 段 描述 、 方 法 描述 等 。 对 于 这 些 区 域 的 测试 ， 基 本 的 思路 是 运 
行 时 产生 大 量 的 类 去 填 满 方法 区 ， 直 到 溢出 。 虽 然 直 接 使 用 Java SE 
API 也 可 以 动态 产生 类 〈 如 反射 时 的 GeneratedConstructorAccessor 和 动 
态 代理 等 ) ， 但 在 本 次 实验 中 操作 起 来 比较 麻烦 。 在 代码 清单 2-8 中 ，， 
笔者 借助 CGLibl 直接 操作 字 节 码 运行 时 生成 了 大 量 的 动态 类 。 


值得 特别 注意 的 是 ， 我 们 在 这 个 例子 中 模拟 的 场景 并 非 纯 粹 是 一 
个 实验 ， 这 样 的 应 用 经 常会 出 现在 实际 应 用 中 : 当前 的 很 多 主流 框 
架 ， 如 Spring、Hibernate， 在 对 类 进行 增强 时 ， 都 会 使 用 到 CGLib 这 类 


字 下 码 技 术 ， 增 强 的 类 越 多 ， 束 需要 越 大 的 方法 区 来 保证 动态 生成 的 
Class 可 以 加 载 入 内 存 。 另 外 ，JVM 上 的 动态 语言 (例如 Groovy 等 ) 通 
常 都 会 持续 创建 类 来 实现 语言 的 动态 性 ， 随 着 这 类 语言 的 流行 ， 也 越 
来 越 容易 遇 到 与 代码 清单 2-8 相 似 的 次 出 场景 。 


代码 清单 2-8 ”借助 CGLib 使 方法 区 出 现 内 存 洲 出 异 汕 


AE 

*VM Args:-XX:PermSize=10M-XX:MaxPermSize=10OM 

*@author zzm 

*/ 

public class JavaMethodArea00M{ 

public static void main (String[]args) { 

while (true) { 

Enhancer enhancer=new Enhancer(); 

enhancer ,setSuperclass (00MObject.class) ; 

enhancer .setUseCache (false) ; 

enhancer .setCallback (new MethodInterceptor(){ 

public Object intercept (Object obj,Method 
method,Object[]args,MethodProxy proxy) throws Throwabletf 

return proxy.invokeSuper (obj,args) ; 


} 

}); 

enhancer .create( ); 

} 

} 

static class OOMObject{ 
} 

} 


运行 结果 : 


Caused by:java.lang.OutofMemoryError:PermGen Space 

at java.lang.classLoader.defineClass1 (Native Method) 

at java.lang.classLoader.defineClassCond (ClassLoader .java:632) 
at java.lang.classLoader.defineClass (ClassLoader .java:616) 


方法 区 液 出 也 是 一 种 常见 的 内 存 淤 出 异常 ， 一 个 类 要 被 垃圾 收集 
器 回收 掉 ， 判 定 条 件 是 比较 苛刻 的 。 在 经 常 动态 生成 大 量 Class 的 应 用 
中 ， 需 要 特别 注意 类 的 回收 状况 。 这 类 场景 除了 上 面 提 到 的 程序 使 用 
了 CGLib 字 节 码 增强 和 动态 语言 之 外 ， 常 见 的 还 有 : 大 量 JSP 或 动态 产 
生 JSP 文 件 的 应 用 (JSP 第 一 次 运行 时 需要 编译 为 Java 类 ) 、 基 于 OSGi 
的 应 用 〈 即 使 是 同一 个 类 文件 ， 被 不 同 的 加 载 器 加 载 也 会 视 为 不 同 的 
类 ) 等 。 


[1]CGLib 开 源 项 目 : http://cglib.sourceforge.net/。 


2.4.4 ”本 机 直接 内 存 洲 出 


DirectMemory 容 量 可 通过 -XX:MaxDirectMemorySize 指 定 ， 如 果 不 
指定 ， 则 默认 与 Java 堆 最 大 值 (-Xmx 指 定 ) 一 样 ， 代 码 清单 2-9 越 过 了 
DirectByteBuffer 类 ， 直 接 通过 反映 获取 Unsafe 实 例 进 行内 存 分 配 

(Unsafe 类 的 getUnsafe() 方 法 限制 了 只 有 引导 类 加 载 器 才 会 返回 实 
例 ， 也 就 是 设计 者 希望 只 有 rtjar 中 的 类 才能 使 用 Unsafe 的 功能 ) 。 
为 ， 虽 然 使 用 DirectByteBuffer 分 配 内 存 也 会 抛 出 内 存 溢出 异常 ， 但 它 
抛 出 异常 时 并 没有 真正 向 操作 系统 申请 分 配 内 存 ， 而 是 通过 计算 得 知 
内 存 无 法 分 配 ， 于 是 手动 抛 出 异常 ， 真 正 申请 分 配 内 存 的 方法 是 


unsafe.allocate Memory() ° 


代码 清单 2-9 ”使 用 unsafe 分 配 本 机 内 存 


/A 

*VM Args:-Xmx20M-XX:MaxDirectMemorySize=10M 

*@author zzm 

*/ 

public class DirectMemoryOOMT{ 

private static final Int_1MB=1024*1024; 

public static void main (String[]jargs) throws Exceptiont{ 
Field unsafeField=Unsafe.class.getDeclaredFields()[0]:; 
unsafeField.setAccessible (true) ; 

Unsafe unsafe= (Unsafe) unsafeField.get (null); 

while (true) { 

unsafe.allocateMemory (_1MB) ; 

} 

} 

} 


运行 结果 : 


Exception in thread"main"java.lang.OutofMemoryError 
at sun.misc.Unsafe.allocateMemory (Native Method) 
at org.fenixsoft .oom.DMOOM.main (DMOOM.java:20) 


由 DirectMemory 导 致 的 内 存 溢 出 ， 一 个 明显 的 特征 是 在 Heap 
Dump 文 件 中 不 会 看 见 明显 的 异常 ， 如 果 读 者 发 现 OOM 之 后 Dump 文 件 
很 小 ， 而 程序 中 又 直接 或 间接 使 用 了 NIO， 那 惑 可 以 考虑 检查 一 下 是 
不 是 这 方面 的 原因 。 


2.5 ”本章 小 结 


通过 本 草 的 学 习 ， 我 们 明白 了 虚拟 机 中 的 内 存 古 如 何 划 分 的 ， 哪 
部 分 区 域 、 什 么 样 的 代码 和 操作 可 能 导致 内 存 洲 出 异 弟 。 昌 然 Java 有 
垃圾 收集 机 制 ， 但 内 存 洲 出 异常 离 我 们 仍然 并 不 站 还 ， 本 草 只 是 讲解 
了 各 个 区 域 出 现 内 存活 出 异常 的 原因 ， 第 3 章 将 详细 讲解 Java 垃 圾 收集 
机 制 为 了 避免 内 存 溢 出 异 音 的 出 现 都 做 了 哪些 努力 。 


第 3 章 ”垃圾 收集 絮 与 内 存 分 配 集 略 


Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 
的 “高 墙 "， 墙 外 面 的 人 想 进 去 ， 墙 里 面 的 人 却 想 出 来 。 


3.1 概述 


说 起 垃圾 收集 〈Garbage Collection,GC) ， 大 部 分 人 都 把 这 项 技术 
当做 Java 语 言 的 伴生 产物 。 事 实 上 ，GC 的 历史 比 Java 和 久远，1960 年 诈 
生 于 MIT 的 Lisp 是 第 一 门 真正 使 用 内 存 动 态 分配 和 垃圾 收集 技术 的 语 
。 当 Lisp 还 在 胚胎 时 期 时 ， 和 人 们 就 在 思考 GC 需要 完成 的 3 件 事情 : 


ll 


哪些 内 存 需 要 回收 ? 
什么 时 候 回 收 ? 
如 何 回 收 ? 


经 过 半 个 多 世纪 的 发 展 ， 目 前 内 存 的 动态 分 配 与 内 存 回 收 技术 已 
经 相当 成 熟 ， 一 切 看 起 来 都 进入 了 “ 目 动 化 "时 代 ， 那 为 什么 我 们 还 要 
去 了 解 GC 和 内 存 分 配 呢 ?答案 很 创 单 ， 当 和 需要 排查 各 种 内 存 洲 出 、 内 
存 泄 漏 问 题 时 ， 当 垃圾 收集 成 为 系统 达到 更 高 并 发 量 的 瓶 贷 时 ， 我 们 
束 需 要 对 这 些 “ 目 动 化 ”的 技术 实施 必要 的 监 挖 和 调和 。 


把 时 间 从 半 个 多 世纪 以 前 拨 回 到 现在 ， 回 到 我 们 熟悉 的 Java 语 
言 。 第 2 章 介绍 了 Java 内 存 运 行 时 区 域 的 各 个 部 分 ， 其 中 程序 计数 套 、 
虚拟 机 栈 、 本 地 方法 栈 3 个 区 域 随 线程 而 生 ， 随 线程 而 丈 ; 栈 中 的 栈 帧 
随 看 方法 的 进入 和 退出 而 有 条 不 率 地 执行 着 出 栈 和 入 栈 操作 。 每 一 个 
栈 帧 中 分 配 多 少 内 存 基本 上 是 在 类 结构 确定 下 来 时 就 已 知 的 (尽管 在 
运行 期 会 由 JIT 编 译 事 进行 一 些 优化 ， 但 在 本 章 基 于 概念 模型 的 讨论 
中 ， 大 体 上 可 以 认为 是 编译 期 可 知 的 ) ， 因 此 这 几 个 区 域 的 内 存 分 配 
和 回收 都 具备 确定 性 ， 在 这 几 个 区 域内 就 不 需要 过 多 考虑 回收 的 问 
题 ， 因 为 方法 结束 或 者 线程 结束 时 ， 内 人 存 目 然 束 跟 随 痢 回收 了 。 而 
Java 堆 和 方法 区 则 不 一 样 ， 一 个 接口 中 的 多 个 实现 类 需要 的 内 存 可 能 
不 一 样 ， 一 个 方法 中 的 多 个 分 文 需要 的 内 存 也 可 能 不 一 样 ， 我 们 只 
在 程序 处 于 运行 期 间 时 才能 知道 会 创建 哪些 对 象 ， 这 部 分 内 存 的 分 配 
和 回收 都 十 动态 的 ， 垃 摇 收 集 器 所 关注 的 是 这 部 分 内 存 ， 本 章 后 续 讨 
论 中 的 “内 存 ” 分 配 与 回收 也 仅 指 这 一 部 分 内 存 。 


32 对 象 已 死 吗 


在 堆 里 面 存 放 痢 Java 世 界 中 几乎 所 有 的 对 象 实例 ， 世 圾 收集 万 在 
对 堆 进行 回收 前 ， 第 一 件 事情 殉 是 要 确定 这 些 对 象 之 中 哪些 还 “ 存 
活着 ， 哪 些 已 经 "死去 ”《 即 不 可 能 再 被 任何 途径 使 用 的 对 象 ) 。 


3.2.1 引用 计数 算法 


很 多 教科 书 判 断 对 象 古 否 存活 的 算法 是 这 样 的 ， 给 对 象 中 添加 一 
个 引用 计数 如 ， 每 当 有 一 个 地 方 引 用 它 时 ， 计 数 右 值 束 加 1; 当 引 用 失 
效 时 ， 计 数 右 值 束 减 1， 任 何 时 刻 计数 右 为 0 的 对 象 就 古 不 可 能 再 锐 使 
用 的 。 作 者 面试 过 很 多 的 应 届 生 和 一 些 有 多 年 工作 经 验 的 开发 人 员 ， 


他 们 对 于 这 个 问题 给 予 的 都 是 这 个 答案 。 


客观 地 说 ， 引 用 计数 算法 (Reference Counting) 的 实现 简单 ， 判 
定 效率 也 很 高 ， 在 大 部 分 情况 下 它 都 是 一 个 不 错 的 算法 ， 也 有 一 些 比 
较 著 名 的 应 用 案例 ， 例 如 微软 公司 的 COM (Component Object 
Model) 技术 、 使 用 ActionScript 3 的 FlashPlayer、Python 语 言 和 在 游戏 
脚本 领域 被 广泛 应 用 的 Squirrel 中 都 使 用 了 引用 计数 算法 进行 内 存 管 
理 。 但 是 ， 至 少 主流 的 Java 虚 拟 机 里 面 没有 选用 引用 计数 算法 来 管理 


内 存 ， 其 中 最 主要 的 原因 是 它 很 难 解决 对 象 之 间 相 互 循环 引用 的 问 


题 。 


举 个 简单 的 例子 ， 请 看 代码 清单 3-1 中 的 testGC() 方 法 : 对象 objA 
和 objB 都 有 字段 instance， 赋 值 令 objA.instance=objB 及 
objB.instance=objA， 除 此 之 外 ， 这 两 个 对 象 再 无 任何 引用 ， 实 际 上 这 
两 个 对 象 已 经 不 可 能 再 被 访问 ， 但 是 它们 因为 互相 引用 着 对 方 ， 导 致 
它们 的 引用 计数 都 不 为 0， 于 是 引用 计数 算法 无 法 通知 GC 收 集 器 回收 


‘ls 


代码 清单 3-1 引用 计数 算法 的 缺陷 


A 

x*testGC() 方 法 执行 后 ，objA 和 objB 会 不 会 被 GC 呢 ? 
*@author zzm 

*/ 

public class ReferenceCountingGC{ 

public Object instance=null; 

private static final int_ 1MB=1024*1024; 


* 这 个 成 员 属 性 的 唯一 意义 就 是 占 点 内 存 ， 以 便 能 在 6C 日 志 中 看 清楚 是 否 被 回收 过 


private byte[]jbigSize=new byte[2*_ 1MB] ; 

public static void testGC(){ 

ReferenceCountingGC objA=new ReferenceCountingGC( ) ; 
ReferenceCountingGC objB=new ReferenceCountingGC( ) ; 
objA.instance=objB; 

objB.instance=objA:; 

objA=null:; 

objB=null:; 

// 假 设 在 这 行 发 生 GC, objA 和 objB 是 否 能 被 回收 ? 

System.gcl( ); 


} 


运行 结果 : 


[Full GC (System) [Tenured:OK->210K (10240K) ,， 0.0149142 
secs]4603K- >210K (19456K) ，[Perm:2999K- >2999K (21248K) ],，0.0150007 
secs|][Times:user=0.01 sys=0.00, real=0.02 Secs] 

Heap 

def new generation total 9216K,used 82K[O0x00000000055e0000， 
0x0000000005fe0000，0x0000000005fe0000) 

Eden Space 8192K，1%used[0x00000000055e0000，0x00000000055f4850， 
90x9000000005de9000) 

from space 1024K，90%used[0x0000000005de0000，0x0000000005de0000， 
9x0000000005ee0000) 

to Space 1024K，0%used[0x0000000005ee0000，0x0000000005ee0000， 
9x0000000005fe0000) 

tenured generation total 10240K, Used 210K[0x0000000005fe0000， 
0x00000000069e0000，0x00000000069e0000) 

the space 10240K，2%used[0x0000000005fe0000，0x0000000006014a18， 
0x0000000006014c00，0x00000000069e0000) 

compacting perm gen total 21248K, Used 3016K[0x00000000069e0000， 
0x0000000007ea0000，0x000000000bde0000) 

the Space 21248K，14%used[0x00000000069e0000， 
0x0000000006cd2398，0x0000000006cd2400，069x0000000007ea0000) 

No Shared spaces configured. 


从 运行 结果 中 可 以 清楚 看 到 ，GC 日 志 中 包含 "4603K->210K"， 意 
味 着 虚拟 机 并 没有 因为 这 两 个 对 象 互相 引用 就 不 回收 它们 ， 这 也 从 侧 
面 说 明 虚 拟 机 并 不 是 通过 引用 计数 算法 来 判断 对 象 是 否 存活 的 。 


3.2.2 ”可 达 性 分 析 算 法 


在 主流 的 商用 程序 语言 (Java、C#， 甚 至 包括 前 面 提 到 的 古老 的 
Lisp) 的 主流 实现 中 ， 都 是 称 通过 可 达 性 分 析 (Reachability Analysis) 
来 判定 对 象 是 否 存 活 的。 这 个 算法 的 基本 思路 就 是 通过 一 系列 的 称 
为 "GC Roots" 的 对 象 作为 起 始点 ， 从 这 些 市 点 开始 向 下 搜索 ， 搜 索 所 走 
过 的 路 径 称 为 引用 链 (Reference Chain) ， 当 一 个 对 象 到 GC Roots 没 有 
任何 引用 链 相 连 (用 图 论 的 话 来 说 ， 就 是 从 GC Roots 到 这 个 对 象 不 可 
达 ) 时 ， 则 证 明 此 对 象 是 不 可 用 的 。 如 图 3-1 所 示 ， 对 象 object 5、 
object 6、object 7 虽然 互相 有 关联 ， 但 是 它们 到 GC Roots 是 不 可 达 的 ， 
所 以 它们 将 会 被 判定 为 是 可 回收 的 对 象 。 


国 切 热 存活 的 对 象 
[|] 判定 可 回收 的 对 象 


图 3-1 可 达 性 分 析 算 法 判定 对 象 是 否 可 回收 
在 Java 语 言 中 ， 可 作为 GC Roots 的 对 象 包 括 下 面 几 种 : 
虚拟 机 栈 〈 栈 帧 中 的 本 地 变量 表 ) 中 引用 的 对 象 。 
方法 区 中 类 静态 属性 引用 的 对 象 。 
方法 区 中 常量 引用 的 对 象 。 


本 地 方法 栈 中 JNI ( 即 一 般 说 的 Native 方 法 ) 引用 的 对 象 。 


3.2.3 ”再 谈 引 用 


无 论 是 通过 引用 计数 算法 判断 对 象 的 引用 数量 ， 还 是 通过 可 达 性 
分 析 算 法 判断 对 象 的 引用 链 是 否 可 达 ， 判 定 对 象 是 否 存 活 都 与 “ 引 
用 ”有 关 。 在 JDK 1.2 以 前 ，Java 中 的 引用 的 定义 很 传统 ， 如 采 reference 
类 型 的 数据 中 存储 的 数值 代表 的 是 另外 一 块 内 存 的 起 始 地 址 ， 束 称 这 
块 内 存 代 表 着 一 个 引用 。 这 种 定义 很 纯粹 ， 但 是 太 过 狭 附 ， 一 个 对 象 
在 这 种 定义 下 只 有 被 引用 或 者 没有 被 引用 两 种 状态 ， 对 于 如 何 描述 一 
些 “ 食 之 无 味 ， 弃 之 可 异 ?” 的 对 象 殉 显 得 无 能 为 力 。 我 们 布 望 能 描述 这 
样 一 类 对 象 : 当 内 存 空间 还 足够 时 ， 则 能 保留 在 内 存 之 中 ;如 果 内 存 
空间 在 进行 垃圾 收集 后 还 是 非常 暴 张 ， 则 可 以 抛弃 这 些 对 象 。 很 多 系 
统 的 缓存 功能 都 符合 这 样 的 应 用 场景 。 


在 JDK 1.2 之 后 ，Java 对 引用 的 概念 进行 了 扩充 ， 将 引用 分 为 强 引 
用 (Strong Reference) 、 软 引用 (Soft Reference) 、 弱 引用 (Weak 
Reference) 、 虚 引用 (Phantom Reference) 4 种 ， 这 4 种 引用 强度 依次 
逐渐 减弱 。 


强 引 用 束 是 指 在 程序 代码 之 中 普 所 存在 的 ， 类 似 "Object obj=new 
Object(0" 这 类 的 引用 ， 只 要 强 引 用 还 存在 ， 垃 圾 收集 絮 永 远 不 会 回收 
掉 被 引用 的 对 象 。 


软 引用 是 用 来 描述 一 些 还 有 用 但 并 非 必需 的 对 象 。 对 于 软 引 用 关 
联 着 的 对 象 ， 在 系统 将 要 发 生 内 存 溢出 异常 之 前 ， 将 会 把 这 些 对 象 列 
进 回 收 范围 之 中 进行 第 二 次 回收 。 如 果 这 次 回收 还 没有 足够 的 内 存 ， 
才 会 抛 出 内 存 溢出 异常 。 在 JDK 1.2 之 后 ， 提 供 了 SoftReference 类 来 实 
现 软 引用 。 


弱 引 用 也 是 用 来 描述 非 必 需 对 象 的 ， 但 是 它 的 强度 比 软 引用 更 弱 
一 些 ， 被 弱 引 用 关联 的 对 象 只 能 生存 到 下 一 次 垃圾 收集 发 生 之 前 。 当 
垃圾 收集 器 工作 时 ， 无 论 当 前 内 存 是 否 足 够 ， 都 会 回收 掉 只 被 弱 引 用 
天 联 的 对 象 。 在 JDK 1.2 之 后 ， 提 供 了 WeakReference 类 来 实现 弱 引 
用 o 


虚 引 用 也 称 为 幽灵 引用 或 者 幻影 引用 ， 它 是 最 弱 的 一 种 引用 关 
系 。 一 个 对 象 是 否 有 虚 引 用 的 存在 ， 完 全 不 会 对 其 生存 时 间 构 成 影 
啊 ， 也 无 法 通过 虚 引 用 来 取得 一 个 对 象 实例 。 为 一 个 对 象 设置 虚 引 用 
天 联 的 唯一 目的 束 是 能 在 这 个 对 象 被 收集 句 回 收 时 收 到 一 个 系统 通 
知 。 在 JDK 1.2 之 后 ， 提 供 了 PhantomReference 类 来 实现 虚 引 用 。 


3.2.4 第 存 还 是 死亡 


即使 在 可 达 性 分 析 算 法 中 不 可 达 的 对 象 ， 也 并 非 是 “ 非 死 不 
可 ”的 ， 这 时 候 它 们 暂时 处 于 “缓刑 ?阶段 ， 要 真正 宣告 一 个 对 象 死亡 ， 
至 少 要 经 历 两 次 标记 过 程 : 如 果 对 象 在 进行 可 达 性 分 析 后 发 现 没有 与 
GC Roots 相 连接 的 引用 链 ， 那 它 将 会 被 第 一 次 标记 并 且 进 行 一 次 镀 
选 ， 往 选 的 条 件 是 此 对 象 是 否 有 必要 执行 finalize(0 方 法 。 当 对 象 没 有 
复 兰 finalize() 方 法 ， 或 者 finalize() 方 法 已 经 被 虚拟 机 调用 过 ， 虚 拟 机 将 
这 两 种 情况 都 视 为 “没有 必要 执行 ”。 


如 采 这 个 对 象 被 判定 为 有 必要 执行 finalize() 方 法 ， 那 么 这 个 对 象 
将 会 放置 在 一 个 叫做 F-Queue 的 队列 之 中 ， 并 在 稍 后 由 一 个 由 虚拟 机 目 
动 建立 的 、 低 优 移 级 的 Finalizer 线 程 去 执行 它 。 这 里 所 谓 的 “执行 ”是 指 
虚拟 机 会 触发 这 个 方法 ， 但 并 不 承诺 会 等 待 它 运行 结束 ， 这 样 做 的 原 
因 是 ， 如 有 果 一 个 对 象 在 finalize(0 方 法 中 执行 缓慢 ， 或 者 发 生 了 和 死 循环 
(更 极端 的 情况 ) ， 将 很 可 能 会 导致 FE-Queue 队 列 中 其 他 对 象 永久 处 于 
等 每 ， 甚 至 导致 整个 内 存 回 收 系统 骨 演 。finalize() 方 法 是 对 象 逃 脱 死 
亡命 运 的 最 后 一 次 机 会 ， 稍 后 GC 将 对 F-Queue 中 的 对 象 进行 第 二 次 小 
规模 的 标记 ， 如 果 对 象 要 在 finalize() 中 成 功 拯 救 自己 一 一 只 要 重新 与 
引用 链 上 的 任何 一 个 对 象 建立 关联 即 可 ， 壁 如 把 自己 (this 关 键 字 ) 赋 
值 给 某 个 类 变量 或 者 对 象 的 成 员 变 量 ， 那 在 第 二 次 标记 时 它 将 被 移 除 


出 “即将 回收 ?的 集合 ， 如 有 果 对 象 这 时 候 还 没有 逃脱 ， 那 基本 上 它 束 真 
的 被 回收 了 。 从 代码 清单 3-2 中 我 们 可 以 看 到 一 个 对 象 的 finalize() 被 执 
行 ， 但 是 它 仍然 可 以 存活 。 


代码 清单 3-2 ”一 次 对 象 目 我 拯救 的 演示 


二 

* 此 代码 演示 了 两 点 : 

*1. 对 象 可 以 在 被 6C 时 自我 拯救 。 

*2 .这 种 自救 的 机 会 只 有 一 次 ， 因 为 一 个 对 象 的 finalize( ) 方 法 最 多 只 会 被 系统 自动 
调用 一 次 

*Q@author zzm 

i 

public class FinalizeEscapeGCct{ 

public static FinalizeEscapeGC SAVE_HOOK=null; 

public void isAlive(){ 

System,out.println ("yes,i am still alive:) ") ; 

} 

Q@Override 

protected void finalize()throws Throwablet{ 

Super ,finalize(); 

System.out.println ("finalize mehtod executed!") ; 

FinalizeEScapeGC,.SAVE_HOOK=this; 


public static void main (String[]args) throws Throwable{ 
SAVE_HOOK=new FinalizeEscapeGC(); 

// 对 象 第 一 次 成 功 拯救 自己 
SAVE_HOOK=nul1l; 
System.gcl( ); 

// 因 为 finalize 方 法 优先 级 很 低 ， 所 以 暂停 9.5 秒 以 等 入 
Thread.sleep (500) ; 
if (SAVE_HOOK!=null 
SAVE_HOOK. isAlive( ): 

}elsef{ 

System.out.println ("no,i am dead: ("); 


才 比 
Ct 


} 

// 下 面 这 段 代码 与 上 面 的 完全 相同 ， 但 是 这 次 自救 却 失败 了 
SAVE_HOOK=nu]]; 

System.gcl( ); 

// 因 为 finalize 方 法 优先 级 很 低 ， 所 以 暂停 0.5 秒 以 等 待 它 
Thread.sleep (500) ; 
if (SAVE_HOOK!=null1) { 


SAVE_HOOK. isAlive( ); 
}elsef{ 
System.out.println ("no,i am dead: ("); 


} 
运行 结果 : 


finalize mehtod executed! 
yes,i am still alive:) 
no,i am dead: 


从 代码 清单 3-2 的 运行 结果 可 以 看 出 ，SAVE_HOOK 对 象 的 
finalize0 方 法 确实 被 GC 收集 器 触发 过 ， 并 且 在 被 收集 前 成 功 逃 脱 了 。 


另外 一 个 值得 注意 的 地 方 是 ， 代 码 中 有 两 段 完 全 一 样 的 代码 片 
段 ， 执 行 结果 却 是 一 次 逃脱 成 功 ， 一 次 失败 ， 这 是 因为 任何 一 个 对 象 
的 finalize0) 方 法 都 只 会 被 系统 目 动 调用 一 次 ， 如 果 对 象 面 临 下 一 次 回 
收 ， 它 的 finalize0) 方 法 不 会 被 再 次 执行 ， 因 此 第 二 段 代码 的 目 救 行动 
失败 了 。 


需要 特别 说 明 的 是 ， 上 面 关于 对 象 死亡 时 finalize(0) 方 法 的 描述 可 
能 市 有 悲情 的 忆 术 色彩 ， 笔 者 并 不 鼓励 大 家 使 用 这 种 方法 来 拯救 对 
象 。 相反 ， 笔 者 建议 大 家 尽量 避免 使 用 它 ， 因 为 它 不 是 C/C++ 中 的 析 
构 函 数 ， 而 是 Java 刚 诞生 时 为 了 使 C/C++ 程序 员 更 容易 接受 它 所 做 出 的 
一 个 妥协 。 它 的 运行 代价 高 昂 ， 不 确定 性 大 ， 无 法 保证 各 个 对 象 的 调 
用 顺序 。 有 些 教材 中 描述 它 适合 做 “关闭 外 部 资源 ”之 类 的 工作 ， 这 完 


全 有 是 对 这 个 方法 用 途 的 一 种 目 我 安慰 。finalize(O) 能 做 的 所 有 工作 ， 使 
用 try-finally 或 者 其 他 方式 都 可 以 做 得 更 好 、 更 及 时 ， 所 以 笔者 建议 大 
家 完全 可 以 起 控 Java 语 言 中 有 这 个 方法 的 存在 。 


3.2.5 回收 方法 区 


很 多 人 认为 方法 区 (或 者 HotSpot 虚 拟 机 中 的 永久 代 ) 是 没有 垃圾 
收集 的 ，Java 虚 拟 机 规范 中 确实 说 过 可 以 不 要 求 虚拟 机 在 方法 区 实现 
垃圾 收集 ， 而 且 在 方法 区 中 进行 垃圾 收集 的 “性 价 比 ” 一 般 比较 低 : 在 
堆 中 ， 尤 其 是 在 新 生 代 中 ， 常 规 应 用 进行 一 次 垃圾 收集 一 般 可 以 回收 
70%~95% 的 空间 ， 而 永久 代 的 垃圾 收集 效率 远 低 于 此 。 


永久 代 的 垃圾 收集 主要 回收 两 部 分 内 容 : 废弃 闻 量 和 无 用 的 类 。 
回收 废弃 常量 与 回收 Java 堆 中 的 对 和 象 非常 类 似 。 以 常量 池 中 字面 量 的 
回收 为 例 ， 假 如 一 个 字符 串 "abc" 已 经 进入 了 常量 池 中 ， 但 是 当前 系统 
没有 任何 一 个 String 对 象 是 叫做 "abc" 的 ， 换 句 话 说 ， 就 是 没有 任何 
String 对 和 象 引 用 常量 池 中 的 "abc" 常 量 ， 也 没有 其 他 地 方 引 用 了 这 个 字 
面 量 ， 如 采 这 时 发 生 内 存 回收 ， 而 且 必要 的 话 ， 这 个 "abc" 党 量 台 会 被 
系统 清理 出 常量 池 。 常 量 池 中 的 其 他 类 (接口 ，、 方 法 、 字 段 的 符号 
引用 也 与 此 类 似 。 


判 害 一 个 常量 是 否 十 “废弃 常量 ”比较 人 简单， 而 要 判定 一 个 类 是 否 
征 “ 无 用 的 类 ”的 条 件 则 相对 奇 刻 许多 。 类 需要 同时 满足 下 面 3 个 条 件 才 
能 算是 “无 用 的 类 ”: 


该 类 所 有 的 实例 都 已 经 被 回收 ， 也 融 是 Java 扒 中 不 存在 该 类 的 任 
何 实例 。 


加 载 该 类 的 ClassLoader 已 经 被 回收 。 


该 类 对 应 的 java.lang.Class 对 象 没 有 在 任何 地 方 被 引用 ， 无 法 在 任 
何 地 方 通过 反射 访问 该 类 的 方法 。 


虚拟 机 可 以 对 满足 上 述 3 个 条 件 的 无 用 类 进行 回收 ， 这 里 说 的 仅仅 
是 “可 以 ”， 而 并 不 是 和 对 象 一 样 ， 不 使 用 了 惑 必 然 会 回收 。 有 是 否 对 类 
进行 回收 ，HotSpot 虚 拟 机 提供 了 -Xnoclassgc 参 数 进 行 控制 ， 还 可 以 使 
用 -verbose:class 以 及 -XX:+TraceClassLoading、- 
XX:+TraceClassUnLoading 查 看 类 加 载 和 纯 载 信息 ， 其 中 -verbose:class 
和 -XX:+TraceClassLoading 可 以 在 Product 版 的 虚拟 机 中 使 用 ，- 
XX:+TraceClassUnLoading 参 数 需要 FastDebug 版 的 虚拟 机 支持 。 


在 大 量 使 用 反射 、 动 态 代 理 、CGLib 等 ByteCode 框 架 、 动 态 生成 
JSP 以 及 OSGi 这 类 频繁 自 定 义 ClassLoader 的 场景 都 需要 虚拟 机 具备 类 
哲 载 的 功能 ， 以 保证 永久 代 不 会 溢出 。 


3.3 垃圾 收集 算法 


由 于 垃圾 收集 算法 的 实现 涉及 大 量 的 程序 细 记 ， 而 且 各 个 平台 的 
虚拟 机 操作 内 存 的 方法 又 各 不 相同 ， 因 此 本 市 不 打算 过 多 地 讨论 算法 
的 实现 ， 只 是 介绍 儿 种 算法 的 思想 及 其 发 展 过 程 。 


3.3.1 标记 -清除 算法 


最 基础 的 收集 算法 十“ 标记- 清除”(Mark-Sweep) 算法 ， 如 同 它 的 
名 字 一 样 ， 算 法 分 为 “标记 ”和 “清除 ”两 个 阶段 ， 首 先 标记 出 所 有 需要 回 
收 的 对 象 ， 在 标记 完成 后 统一 回收 所 有 被 标记 的 对 象 ， 它 的 标记 过 程 
其 实在 前 一 让 讲述 对 象 标记 判定 时 已 经 介绍 过 了 。 之 所 以 说 它 古 最 基 
础 的 收集 算法 ， 是 因为 后 续 的 收集 算法 都 十 基于 这 种 思路 并 对 其 不 足 
进行 改进 而 得 到 的 。 它 的 主要 不 足 有 两 个 : 一 个 是 效率 问题 ， 标 记 和 
清除 两 个 过 程 的 效率 都 不 高 ， 男 一 个 是 空间 问题 ， 标 记 清 除 之 后 会 产 
生 大 量 不 连续 的 内 存 碎片 ， 空 间 碎片 太 多 可 能 会 导致 以 后 在 程序 运行 
过 程 中 需要 分 配 较 大 对 象 时 ， 无 法 找到 足够 的 连续 内 存 而 不 得 不 提前 
触发 另 一 次 垃圾 收集 动作 。 标 记 一 清除 算法 的 执行 过 程 如 图 3-2 所 示 。 


存活 对 象 未 使 用 


图 3-2 “标记 -清除 ”算法 示意 图 


3.3.2 ”复制 算法 


为 了 解决 效率 问题 ， 一 种 称 为 “复制 ”(Copying) 的 收集 算法 出 现 
了 ， 它 将 可 用 内 存 按 容量 划分 为 大 小 相等 的 两 块 ， 每 次 只 使 用 其 中 的 
一 块 。 当 这 一 块 的 内 存 用 完了 ， 避 ® 将 还 存活 着 的 对 象 复制 到 男 外 一 块 
上 上 面 ， 然 后 再 把 已 使 用 过 的 内 存 空间 一 次 清理 挥 。 这 样 使 得 每 次 者 是 
对 整个 半 区 进行 内 存 回收 ， 内 存 分 配 时 也 束 不 用 考虑 内 存 人 碎片 等 复杂 
情况 ， 只 要 移动 堆 顶 指针 ， 按 顺序 分 配 内 存 即 可 ， 实 现 简单 ， 运 行 高 
效 。 只 是 这 种 算法 的 代价 是 将 内 存 缩小 为 了 原来 的 一 半 ， 未 兔 太 高 了 
一 点 。 复 制 算法 的 执行 过 程 如 图 3-3 所 示 。 


保留 区 域 


可 回收 未 使 用 | 
图 3-3 复制 算法 示意 图 


现在 的 商业 虚拟 机 都 采用 这 种 收集 算法 来 回收 新 生 代 ，IBM 公 司 
的 专门 研究 表明 ， 新 生 代 中 的 对 象 98% 是 “ 朝 生 夕 死 " 的 ， 所 以 并 不 需要 
按照 1:1 的 比例 来 划分 内 存 空间 ， 而 是 将 内 存 分 为 一 块 较 大 的 Eden 空 间 
和 两 块 较 小 的 Survivor 空 间 ， 每 次 使 用 Eden 和 其 中 一 块 SurvivoriH1。 当 
回收 时 ， 将 Eden 和 Survivor 中 还 存活 着 的 对 象 一 次 性 地 复制 到 男 外 一 块 
Survivor 空 间 上 ， 最 后 清理 掉 Eden 和 刚才 用 过 的 Survivor 空 间 。HotSpot 
虚拟 机 默认 Eden 和 Survivor 的 大 小 比例 是 8:1， 也 就 是 每 次 新 生 代 中 可 用 
内 存 空间 为 整个 新 生 代 容量 的 90% (80%+10%) ， 只 有 109% 的 内 存 会 
被 “浪费 ”。 当然 ，98% 的 对 象 可 回收 只 是 一 般 场景 下 的 数据 ， 我 们 没有 
办 法 保证 每 次 回收 都 只 有 不 多 于 10% 的 对 象 存活 ， 当 Survivor 空 间 不 够 
用 时 ， 需 要 依赖 其 他 内 存 (这 里 指 老年 代 ) 进行 分 配 担保 (Handle 


Promotion) 。 


内 存 的 分 配 担 体 束 好 比 我 们 去 银行 借款 ， 如 琳 我 们 信誉 很 好 ， 在 
98% 的 情况 下 都 能 按时 俱 还 ， 于 古 银 行 可 能 会 默认 我 们 下 一 次 也 能 按时 
按 量 地 偿还 贷款 ， 只 需要 有 一 个 担保 人 能 保证 如 果 我 不 能 还 款 时 ， 可 
以 从 他 的 账户 扣 钱 ， 那 银行 整 认为 没有 风险 了 。 内 存 的 分 配 担 保 也 一 
样 ， 如 果 另 外 一 块 Survivor 空 间 没 有 足够 空间 存放 上 一 次 新 生 代 收集 下 
来 的 存活 对 象 时 ， 这 些 对 象 将 直接 通过 分 配 担 保 机 制 进 入 老年 代 。 关 
于 对 新 生 代 进行 分 配 担 保 的 内 容 ， 在 本 章 稍 后 在 讲解 垃圾 收集 器 执行 
规则 时 还 会 再 评 细 讲解 。 


[1] 这 里 需要 说 明 一 下 ， 在 HotSpot 中 的 这 种 分 代 方 式 从 最 初 就 是 这 种 布 
局 ， 与 IBM 的 人 研究 并 没有 什么 实际 联系 。 本 书 列举 IBM 的 人 研究 只 是 为 了 
说 明 这 种 分 代 布局 的 意义 所 在 。 


3.3.3 ”标记 -整理 算法 


复制 收集 算法 在 对 象 存活 率 较 高 时 就 要 进行 较 多 的 复制 操作 ， 效 
率 将 会 变 低 。 更 关键 的 是 ， 如 果 不 想 浪费 50% 的 空间 ， 束 需要 有 和 额外 的 
空间 进行 分 配 担 保 ， 以 应 对 被 使 用 的 内 存 中 所 有 对 象 都 100% 存 活 的 极 
端 情况 ， 所 以 在 老年 代 一 般 不 能 直接 选用 这 种 算法 。 


根据 老年 代 的 特点 ， 有 人 提出 了 另外 一 种 “标记 -整理 ”(\Mark- 
Compact) 算法 ， 标 记过 程 仍然 与 “标记 -清除 ”算法 一 样 ， 但 后 续 步 又 不 
是 直接 对 可 回收 对 象 进行 清理 ， 而 是 让 所 有 存活 的 对 象 都 向 一 端 移 
动 ， 然 后 直接 清理 掉 端 边界 以 外 的 内 存 ,，“ 标 记 - 整 理 ” 算 法 的 示意 图 如 
图 3-4 所 示 。 


存活 对 象 可 回收 未 使 用 


图 3-4 “标记 -整理 ”算法 示意 图 


3.3.4 分 代 收 集 算法 


当前 商业 虚拟 机 的 垃圾 收集 都 采用 “分 代 收 集 ” (Generational 
Collection) 算法 ， 这 种 算法 并 没有 什么 新 的 思想 ， 只 是 根据 对 象 存活 
周期 的 不 同 将 内 存 划分 为 几 块 。 一 般 生 把 Java 扒 分 为 新 生 代 和 老年 
代 ， 这 样 吏 可 以 根据 各 个 年 代 的 特点 采用 最 适当 的 收集 算法 。 在 新生 
代 中 ， 每 次 二 圾 收集 时 都 发 现 有 大 批 对 象 死 去 ， 只 有 少量 存活 ， 那 惑 
选用 复制 滤 法 ， 只 需要 付出 少量 存活 对 象 的 复制 成 本 就 可 以 完成 收 
集 。 而 老年 代 中 因为 对 象 存活 率 高 、 没 有 额外 空间 对 它 进行 分 配 担 
保 ， 殊 必须 使 用 “标记 一 清理 ”或 者 “标记 一 整理 ”算法 来 进行 回收 。 


3.4 HotSpot 的 算法 实现 


3.2” 玫 和 3.3 帮 从 理论 上 介绍 了 对 象 存 活 判 定 算 法 和 垃圾 收集 算 
法 ， 而 在 HotSpot 虚 拟 机 上 实现 这 些 算法 时 ， 必 须 对 算法 的 执行 效率 有 
产 格 的 考量 ， 才 能 保证 虚拟 机 高 效 运行 。 


3.4.1 ” 枚 举 根 节点 


从 可 达 性 分 析 中 从 GC Roots 节 点 找 引 用 链 这 个 操作 为 例 ， 可 作为 
GC Roots 的 节点 主要 在 全 局 性 的 引用 (例如 常量 或 类 静态 属性 ) 与 执 
行 上 下 文 《例如 栈 帧 中 的 本 地 变量 表 ) 中 ， 现 在 很 多 应 用 仅仅 方法 区 
束 有 数 百 兆 ， 如 采 要 逐个 检查 这 里 面 的 引用 ， 那 么 必然 会 消耗 很 多 时 
间 。 


男 外 ， 可 达 性 分 析 对 执行 时 间 的 敏感 还 体现 在 GC 停顿 上 ， 因 为 这 
项 分 析 工 作 必须 在 一 个 能 确保 一 致 性 的 快照 中 进行 一 一 这 里 “一 致 
性 ”的 意思 是 指 在 整个 分 析 期 间 整 个 执行 系统 看 起 来 号 像 被 冻结 在 某 个 
时 间 点 上 ， 不 可 以 出 现 分 析 过 程 中 对 象 引 用 关系 还 在 不 断 变 化 的 情 
况 ， 该 点 不 满足 的 话 分 析 结 末 准 确 性 吏 无 法 得 到 保证 。 这 点 是 导致 GC 
进行 时 必须 停顿 所 有 Java 执 行 线程 《Sun 将 这 件 事情 称 为 "Stop The 


World") 的 其 中 一 个 重要 原因 ， 即 使 是 在 号 称 (几乎 不 会 发 生 停顿 
的 CMS 收集 历 中 ， 枚 举 根 世 点 时 也 是 必须 要 停顿 的 。 


由 于 目前 的 主流 Java 虚 拟 机 使 用 的 都 是 准确 式 GC (这 个 概念 在 第 
1 章 介绍 Exact VM 对 Classic VM 的 改进 时 讲 过 ) ， 所 以 当 执行 系统 停顿 
下 来 后 ， 并 不 需要 一 个 不 漏 地 检查 完 所 有 执行 上 下 文 和 全 局 的 引用 位 
置 ， 虚 拟 机 应 当 是 有 办 法 直接 得 知 哪些 地 方 存放 着 对 象 引 用 。 在 
HotSpot 的 实现 中 ， 有 是 使 用 一 组 称 为 OopMap 的 数据 结构 来 达到 这 个 目 
的 的 ， 在 类 加 载 完 成 的 时 候 ，HotSpot 就 把 对 象 内 什么 偏 移 量 上 是 什么 
类 型 的 数据 计算 出 来 ， 在 JIT 编 译 过 程 中 ， 也 会 在 特定 的 位 置 记录 下 栈 
和 寄存 器 中 哪些 位 置 是 引用 。 这 样 ，GC 在 扫描 时 就 可 以 直接 得 知 这 些 
言 息 了 。 下 面 的 代码 清单 3-3 是 HotSpot Client VM 生成 的 一 段 
String.hashCode() 方 法 的 本 地 代码 ， 可 以 看 到 在 0x026eb7a9 处 的 call 指 
令 有 OopMap 记 录 ， 它 指明 了 EBX 寄 存 器 和 栈 中 偏 移 量 为 16 的 内 存 区 
域 中 各 有 一 个 普通 对 象 指针 (Ordinary Object Pointer) 的 引用 ， 有 效 
范围 为 从 call 指 令 开始 直到 0x026eb730 (指令 流 的 起 始 位 置 ) +142 

(OopMap 记 录 的 偏 移 量 ) =0x026eb7be， 即 hlt 指 令 为 止 。 


代码 清单 3-3 ”String.hashCode() 方 法 编译 后 的 本 地 代码 


[Verified Entry Point] 
9x026eb730:mov%eax，-0x8000 (%esp) 
; ImplicitNullCheckStub slow case 
Ox026eb7a9:call 0x026e83e0 

; OopMap{ebx=00p[16]=00p off=142} 


; *Caload 

-java.lang.String:hashCode@48 (line 1489) 
; {runtime_call} 
Ox026eb7ae:push$0x83c5c18 
; {external_word} 
Ox026eb7b3:call Ox026eb7b8 
Ox026eb7b8:pusha 
Ox026eb7b9:call Ox0822bec0; {runtime_call} 
Ox026eb7be:hit 


342 安全 总 


在 OopMap 的 协助 下 ，HotSpot 可 以 快速 且 准 确 地 完成 GC Roots 枚 
举 ， 但 一 个 很 现实 的 问题 随 之 而 来 : 可 能 导致 引用 关系 变化 ， 或 者 说 
OopMap 内 容 变 化 的 指令 非常 多 ， 如 果 为 每 一 条 指令 都 生成 对 应 的 
OopMap， 那 将 会 需要 大 量 的 额外 空间 ， 这 样 GC 的 空间 成 本 将 会 变 得 


很 高 。 


了 


实际 上 ，HotSpot 也 的 确 没 有 为 每 条 指令 部 生成 OopMap， 前 面 已 
经 提 到 ， 只 是 在 “特定 的 位 置 ” 记 录 了 这 些 信息 ， 这 些 位 置 称 为 安全 点 
(Safepoint) ， 即 程序 执行 时 并 非 在 所 有 地 方 都 能 停顿 下 来 开始 GC， 
只 有 在 到 达 安 全 点 时 才能 暂停。Safepoint 的 选 定 既 不 能 太 少 以 致 于 让 
GC 等 待 时 间 太 长 ， 也 不 能 过 于 频繁 以 致 于 过 分 增 大 运行 时 的 负 何 。 所 
以 ， 安 全 点 的 选 是 基本 上 是 以 程序 “是 否 具 有 让 程序 长 时 间 执 行 的 特 
征 ” 为 标准 进行 选 定 的 一 一 因为 每 条 指令 执行 的 时 间 都 非常 短暂 ， 程 序 
不 太 可 能 因为 指令 流 长 度 太 长 这 个 原因 而 过 长 时 间 运 行 ,“ 长 时 间 执 
行 ” 的 最 明显 特征 束 是 指令 序列 复 用 ， 例 如 方法 调用 、 循 环 路 转 、 异 党 
跳 转 等 ， 所 以 具有 这 些 功 能 的 指令 才 会 产生 Safepoint 。 


对 于 Safepoint， 另 一 个 需要 考虑 的 问题 是 如 何在 GC 发 生 时 让 所 有 
线程 〈 这 里 不 包括 执行 JNI 调 用 的 线程 ) 都 < 跑 ? 到 最 近 的 安全 点 上 再 停 


顿 下 来 。 这 里 有 两 种 方案 可 供 选 择 : 抢先 式 中 断 (Preemptive 
Suspension) 和 主动 式 中 断 (Voluntary Suspension) ， 其 中 抢先 式 中 断 
不 需要 线程 的 执行 代码 主动 去 配合 ， 在 GC 发 生 时 ， 首 先 把 所 有 线程 全 
部 中 断 ， 如 果 发 现 有 线程 中 断 的 地 方 不 在 安全 点 上 ， 就 恢复 线程 ， 让 
它 “ 跑 ?到 安全 点 上 “。 现 在 几乎 没有 虚拟 机 实现 采用 抢先 式 中 断 来 暂停 
线程 从 而 啊 应 GC 事 件 。 


而 主动 式 中 断 的 思想 生 当 GC 需 要 中 断 线程 的 时 候 ， 不 直接 对 线程 
操作 ， 仅 仅 简 单 地 设置 一 个 标志 ， 各 个 线程 执行 时 主动 去 轮 询 这 个 标 
志 ， 发 现 中 断 标志 为 真 时 就 目 己 中 断 挂 起 。 轮 询 标 志 的 地 方 和 安全 点 
有 古 重合 的 ， 男 外 再 加 上 创建 对 象 需 要 分 配 内 存 的 地 方 。 下 面 代码 清单 
3-4 中 的 test 指 令 是 HotSpot 生 成 的 轮 询 指令 ， 当 需要 和 暂停 线程 时 ， 虚 拟 
机 把 0x160100 的 内 存 页 设置 为 不 可 读 ， 线 程 执 行 到 test 指 令 时 就 会 产生 
一 个 目 隐 异常 信和 号， 在 预 完 注 册 的 异常 处 理 絮 中 暂 集 线程 实现 等 得 ， 
这 样 一 条 汇编 指令 便 完 成 安全 点 轮 询 和 触发 线程 中 断 。 


代码 清单 3-4 轮 询 指令 


OxO1b6d627:call Ox01b2b210; OopMap{[60]=00p off=460} 
; *invokeinterface size 

; -Clienti:main@113 (line 23) 

; {virtual call} 

0x01b6d62c:nop 

; OopMap{[60]=00p off=461} 

; *if_icmplt 

; -Client1i:main@118 (line 23) 

OxO1b6d62d: test%eax, Ox160100; {poll} 

OxO1b6d633:mov Qx50 (%esp) ，%esi 


OxO1b6d637:cmp%eax, %esi 


OC 


3 3 安全 区 城 


使 用 Safepoint 似 乎 已 经 完美 地 解决 了 如 何 进 入 GC 的 问题 ,但 实际 
情况 却 并 不 一 定 。Safepoint 机 制 保证 了 程序 执行 时 ， 在 不 太 长 的 时 间 
内 就 会 遇 到 可 进入 GC 的 Safepoint。 但 是 ， 程 序 “ 不 执行 ”的 时 候 呢 ?所 
谓 的 程序 不 执行 就 是 没有 分 配 CPU 时 间 ， 典 型 的 例子 就 是 线程 处 于 
Sleep 状态 或 者 Blocked 状 态 ， 这 时 候 线 程 无 法 啊 应 JVM 的 中 断 请 
求 ,，“ 走 ”到 安全 的 地 方 去 中 断 挂 起 ，JVM 也 显然 不 太 可 能 等 得 线程 重 
新 被 分 配 CPU 时 间 。 对 于 这 种 情况 ， 就 需要 安全 区 域 (Safe Region) 
来 解决 。 


安全 区 域 是 指 在 一 段 代码 片段 之 中 ，3 引 用 关系 不 会 发 生变 化 。 在 
这 个 区 域 中 的 任意 地 方 开始 GC 都 是 安全 的 。 我 们 也 可 以 把 Safe Region 
看 做 是 被 扩展 了 的 Safepoint 。 


在 线程 执行 到 Safe Region 中 的 代码 时 ， 首 先 标识 自己 已 经 进入 了 
Safe Region， 那 样 ， 当 在 这 段 时 间 里 JVM 要 发 起 GC 时 ， 就 不 用 管 标识 
自己 为 Safe Region 状 态 的 线程 了 。 在 线程 要 离开 Safe Region 时 ， 它 要 
检查 系统 是 否 已 经 完成 了 根 节 点 枚 举 〈 或 者 是 整个 GC 过 程 ) ， 如 果 完 
成 了 ， 那 线程 就 继续 执行 ， 否 则 它 就 必须 等 待 直到 收 到 可 以 安全 离开 
Safe Region 的 信号 为 止 。 


到 此 ， 笔 者 简要 地 介绍 了 HotSpot 虚 拟 机 如 何 去 发 起 内 存 回收 的 问 
题 ， 但 是 虚拟 机 如 何 具体 地 进行 内 存 回收 动作 仍然 未 涉及 ， 因 为 内 存 


回收 如 何 进行 是 由 虚拟 机 所 采用 的 GC 收集 器 决定 的 ， 而 通常 虚拟 机 中 
主 往 不 止 有 一 种 GC 收集 右 。 下 面 继续 来 看 HotSpot 中 有 哪些 GC 收集 


pt 


Ss 


LD 


局 
0 


3.5 ”垃圾 收集 如 


如 果 说 收集 算法 是 内 存 回 收 的 方法 论 ， 那 么 垃圾 收集 器 就 是 内 存 
回收 的 具体 实现 。Java 虚 拟 机 规范 中 对 垃圾 收集 器 应 该 如 何 实现 并 没有 
任何 规定 ， 因 此 不 同 的 厂商 、 不 同 版 本 的 虚拟 机 所 提供 的 垃圾 收集 器 
都 可 能 会 有 很 大 差别 ， 并 且 一 般 都 会 提供 参数 供用 户 根据 自己 的 应 用 
特点 和 要 求 组 合 出 各 个 年 代 所 使 用 的 收集 器 。 这 里 讨论 的 收集 器 基于 
JDK 1.7 Update 14 之 后 的 HotSpot 虚 拟 机 〈 在 这 个 版 本 中 正式 提供 了 商 
用 的 G1 收集 器 ， 之 前 G1 仍 处 于 实验 状态 ， 这 个 虚拟 机 包含 的 所 有 收 


集 器 如 图 3-5 所 示 。 


Young generation 


Parallel 
用 到 


Tenured generation 


图 3-5 ” HotSpot 虚拟 机 的 垃圾 收集 器 由 


图 3-5 展 示 了 7 种 作用 于 不 同 分 代 的 收集 种 ， 如 采 两 个 收集 瑚 之 间 存 
在 连 线 ， 就 说 明 它们 可 以 搭配 使 用 。 虚 拟 机 所 处 的 区 域 ， 则 表示 它 是 
属于 新 生 代 收 集 器 还 是 老年 代 收 集 器 。 接 下 来 笔者 将 逐一 介绍 这 些 收 
集 紫 的 特性、 基本 原理 和 使 用 场景 ， 并 重点 分 析 CMS 和 G1 这 两 球 相 对 
复杂 的 收集 器 ， 了 解 它们 的 部 分 运作 细节 。 


在 介绍 这 些 收集 器 各 目的 特性 之 前 ， 我 们 先 来 明确 一 个 观点 : 虽 
然 我 们 十 在 对 各 个 收集 器 进行 比较 ， 但 并 非 为 了 挑选 出 一 个 最 好 的 收 


集 占 。 因 为 直到 现在 为 止 还 没有 最 好 的 收集 占 出 现 ， 更 加 没有 万 能 的 
收集 器 ， 所 以 我 们 选择 的 只 是 对 具体 应 用 最 合适 的 收集 器 。 这 点 不 需 
多 


疾 


加 解释 束 能 证 明 : 如 末 有 一 种 放 之 四 海 害 准 、 任 何 场景 下 都 适用 
的 完 类 收集 器 存在 ， 那 HotSpot 虚 拟 机 整 没 必要 实现 那么 多 不 同 的 收集 
是 了 。 


3.5.1 ”Serial 收 集 器 


Serial 收 集 器 是 最 基本 、 发 展 历 史 最 悠久 的 收集 器 ， 曾 经 (在 JDK 
1.3.1 之 前 ) 是 虚拟 机 新 生 代 收集 的 唯一 选择 。 大 家 看 名 字 就 会 知道 ， 
这 个 收集 器 是 一 个 单线 程 的 收集 器 ， 但 它 的 “单线 程 ” 的 意义 并 不 仅仅 
说 明 它 只 会 使 用 一 个 CPU 或 一 条 收集 线程 去 完成 垃圾 收集 工作 ， 更 重 
要 的 是 在 它 进行 垃圾 收集 上 时， 必须 暂停 其 他 所 有 的 工作 线程 ， 直 到 它 
收集 结束 。"Stop The World" 这 个 名 字 也 许 听 起 来 很 酷 ， 但 这 项 工作 实 
际 上 是 由 虚拟 机 在 后 台 自 动 发 起 和 自动 完成 的 ， 在 用 户 不 可 见 的 情况 
下 把 用 户 正 党 工作 的 线程 全 部 停 掉 ， 这 对 很 多 应 用 来 说 都 是 难以 接受 
的 。 读 者 不 妨 试想 一 下 ， 要 是 你 的 计算 机 每 运行 一 个 小 时 就 会 暂停 响 
应 5 分 钟 ， 你 会 有 什么 样 的 心情 ? 图 3-6 示 意 了 Serial/Serial Old 收集 器 的 


运行 过 程 。 


用 户 训 程 1 


CPU0 
户 线程 2 GC 线程 GC 线程 
CPU 1mm 朋 2 
CPU 2 用 户 试 程 3 新 生 代 采取 复制 算法 老年 代 采 职 标 记 - 葡 理 算法 
用 户 线程 4 暂停 所 有 用 户 线程 暂停 所 有 用 户 线 程 
CPU 3 


图 3-6 Serial/Serial Old 收集 器 运行 示意 图 


对 于 "Stop The World" 市 给 用 户 的 不 恨 体 长 ， 虚 拟 机 的 设计 者 们 表 
示 完 全 理解 ， 但 也 表示 非常 委 届 :“ 你 妈妈 在 给 你 打扫 房间 的 时 候 ， 肯 
定 也 会 让 你 老 老 实 实地 在 椅子 上 或 者 房间 外 竺 着， 如 采 她 一 边 打 扫 ， 
你 一 边 乱 扔 纸 屑 ， 这 房间 还 能 打扫 完 ?” ”这 确实 是 一 个 合情合理 的 矛 
盾 ， 虽 然 垃圾 收集 这 项 工作 听 起 来 和 打扫 房间 属于 一 个 性 质 的 ， 但 实 
际 上 肯定 还 要 比 打 扫 房 间 复 杂 得 多 啊 ! 


从 JDK 1.3 开 始 ， 一 直到 现在 最 新 的 JDK 1.7，HotSpot 虚 拟 机 开发 
团队 为 消除 或 者 减少 工作 线程 因 内 存 回收 而 导致 停顿 的 努力 一 直 在 进 
行 着 ， 从 Serial 收 集 器 到 Parallel 收 集 器 ， 再 到 Concurrent Mark Sweep 

(CMS) 力 至 GC 收集 器 的 最 前 沿 成 果 Garbage First (G1) 收集 器 ， 我 
们 看 到 了 一 个 个 越 来 越 优秀 (也 越 来 越 复 杂 ) 的 收集 器 的 出 现 ， 用 户 
线程 的 停顿 时 间 在 不 断 缩短 ， 但 是 仍然 没有 办 法 完全 消除 (这 里 暂 不 
包括 RTSJ 中 的 收集 器 ) 。 寻 找 更 优秀 的 垃圾 收集 器 的 工作 仍 在 继续 ! 


写 到 这 里 ， 笔 者 似乎 已 经 把 Serial 收 集 絮 描述 成 一 个 “ 老 而 无 用 、 食 
之 无 味 弃 之 可 惜 ” 的 鸡 肪 了 ， 但 实际 上 到 现在 为 止 ， 它 依然 是 虚拟 机 运 


行 在 Client 模 式 下 的 默认 新 生 代 收 集 器 。 它 也 有 着 优 于 其 他 收集 右 的 地 
方 : 简单 而 高 效 〈 与 其 他 收集 器 的 单线 程 比 ) ， 对 于 限定 单个 CPU 的 
环境 来 说 ，Serial 收 集 帮 由 于 没有 线程 交互 的 开销 ， 专 心 做 垃圾 收集 日 
然 可 以 获得 最 高 的 单线 程 收集 效率 。 在 用 户 的 桌面 应 用 场景 中 ， 分 配 
给 虚拟 机 管理 的 内 存 一 般 来 说 不 会 很 大 ， 收 集 几 十 兆 甚 至 一 两 百 兆 的 
新 生 代 〈 仅 仅 是 新 生 代 使 用 的 内 存 ， 桌 面 应 用 基本 上 不 会 再 大 了 ) ， 
停顿 时 间 完 全 可 以 欣 制 在 儿 十 毫秒 最 多 一 百 多 毫秒 以 内 ， 只 要 不 是 频 
繁 发 生 ， 这 点 停顿 是 可 以 接受 的 。 所 以 ，Serial 收 集 器 对 于 运行 在 Client 
模式 下 的 虚拟 机 来 说 是 一 个 很 好 的 选择 。 


[1] 图 片 来 源 : http://blogs.sun.conyjonthecollector/entry/our_collectors ° 


3.5.2 ”ParNew 收 集 器 


ParNew 收 集 器 其 实 就 是 Serial 收 集 器 的 多 线程 版 本 ， 除 了 使 用 多 条 
线程 进行 垃圾 收集 之 外 ， 其 余 行为 包括 Serial 收 集 器 可 用 的 所 有 控制 参 
数 (例如 : -XX:SurvivorRatio、-XX:PretenureSizeThreshold、- 
XX:HandlePromotionFailure 等 ) 、 收 集 算法 、Stop The World、 对 象 分 
配 规划、 回收 策略 等 都 与 Serial 收 集 器 完全 一 样 ， 在 实现 上 ， 这 两 种 收 
集 器 也 共用 了 相当 多 的 代码 。ParNew 收 集 器 的 工作 过 程 如 图 3-7 所 示 。 


用 户 线 程 1 


CPU DO 

CPU 1 用 户 线程 2 

CPU Dem 昌 六 2 老年 代 采 取 标记 -整理 算法 

CPU 3 有 FS 新 生 代 采 职 复制 算法 暂停 所 有 用 户 总 各 
暂停 所 有 用 户 线程 


Safepoint Safepoint 


一 /一 


图 3-7 ParNew/Serial Old 收集 器 运行 示意 图 


ParNew 收 集 器 除了 多 线程 收集 之 外 ， 其 他 与 Serial 收 集 器 相 比 并 没 
有 太 多 创新 之 处 ， 但 它 却 是 许多 运行 在 Server 模 式 下 的 虚拟 机 中 首选 的 
新 生 代 收集 器 ， 其 中 有 一 个 与 性 能 无 关 但 很 重要 的 原因 是 ， 除 了 Serial 
收集 器 外 ， 目 前 只 有 它 能 与 CMS 收 集 器 配合 工作 。 在 JDK 1.5 时 期 ， 
HotSpot 推 出 了 一 款 在 强 交互 应 用 中 几乎 可 认为 有 划时代 意义 的 垃圾 收 
集 器 一 -CMS 收集 器 (Concurrent Mark Sweep， 本 节 稍 后 将 详细 介绍 
这 款 收 集 器 ) ， 这 款 收 集 器 是 HotSpot 虚 拟 机 中 第 一 款 真正 意义 上 的 并 


发 〈Concurrent) 收集 器 ， 它 第 一 次 实现 了 让 垃圾 收集 线程 与 用 户 线程 
(基本 上 ) 同时 工作 ， 用 前 面 那 个 例子 的 话 来 说 ， 就 是 做 到 了 在 你 的 
妈妈 打扫 房间 的 时 候 你 还 能 一 边 往 地 上 扔 纸 悄 。 


不 地 的 是 ，CMS 作 为 老年 代 的 收集 器 ， 却 无 法 与 JDK 1.4.0 中 已 经 
存在 的 新 生 代 收集 器 Parallel Scavenge 配 合 工作 由， 所 以 在 JDK 1.5 中 使 
用 CMS 来 收集 老年 代 的 时 候 ， 新 生 代 只 能 选择 ParNew 或 者 Serial 收 集 器 
中 的 一 个 。ParNew 收 集 器 也 是 使 用 -XX:+UseConcMarkSweepGC 选 项 后 
的 默认 新 生 代 收 集 器 ， 也 可 以 使 用 -XX:+UseParNewGC 选 项 来 强制 指定 
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已 O 


ParNew 收 集 器 在 单 CPU 的 环境 中 绝对 不 会 有 比 Serial 收 集 器 更 好 的 
效果 ， 甚 至 由 于 存在 线程 交互 的 开销 ， 该 收集 器 在 通过 超 线程 技术 实 
现 的 两 个 CPU 的 环境 中 都 不 能 百分之百 地 保证 可 以 超越 Serial 收 集 器 。 
当然 ， 随 着 可 以 使 用 的 CPU 的 数量 的 增加 ， 它 对 于 GC 时 系统 资源 的 有 
效 利 用 还 是 很 有 好 处 的 。 它 默认 开局 的 收集 线程 数 与 CPU 的 数量 相 
同 ， 在 CPU 非常 多 〈 璧 如 32 个 ， 现 在 CPU 动 加 就 4 核 加 超 线 程 ， 服 务 器 
超过 32 个 逻辑 CPU 的 情况 越 来 越 多 了 ) 的 环境 下 ， 可 以 使 用 - 
XX:ParallelGCThreads 参 数 来 限制 垃圾 收集 的 线程 数 。 


注意 ”从 ParNew 收 集 器 开始 ， 后 面 还 会 接触 到 几 款 并 发 和 并 行 的 
收集 右 。 在 大 家 可 能 产生 疑惑 之 前 ， 有 必要 先 解释 两 个 名 词 : 并 发 和 


并 行 。 这 两 个 名 词 都 是 并 发 编程 中 的 概念 ， 在 谈论 垃圾 收集 器 的 上 下 
文 语 境 中 ， 它 们 可 以 解释 如 下 。 


e 并 行 (Parallel) : 指 多 条 垃圾 收集 线程 并 行 工 作 ， 但 此 时 用 户 线 
程 仍然 处 于 等 待 状态 。 


e 并 发 (Concurrent) : 指 用 户 线 程 与 垃圾 收集 线程 同时 执行 (但 
不 一 定 是 并 行 的 ， 可 能 会 交 共 执行) ， 用 户 程序 在 继续 运行 ， 而 垃圾 
收集 程序 运行 于 另 一 个 CPU 上 。 


[1]Parallel Scavenge 收 集 右 及 后 面 提 人 到 的 G1 收集 如 部 没 有 使 用 传统 的 
GC 收集 器 代码 框架 ， 而 另外 独立 实现 ， 其 余 几 种 收集 器 则 共用 了 部 分 
的 框架 人 代码， 详细 内 容 可 参考 


http://blogs.sun.com/jonthecollector/entry/our_collectors ° 


3.5.3 ”Parallel Scavenge 收 集 希 


Parallel Scavenge 收 集 器 是 一 个 新 生 代 收集 器 ， 它 也 是 使 用 复制 算 
法 的 收集 器 ， 又 是 并 行 的 多 线程 收集 器 .…… 看 上 去 和 ParNew 都 一 样 ， 
那 它 有 什么 特别 之 处 呢 ? 


Parallel Scavenge 收 集 器 的 特点 是 它 的 关注 点 与 其 他 收集 器 不 同 ， 
CMS 等 收集 器 的 关注 点 是 尽 可 能 地 缩短 垃圾 收集 时 用 户 线程 的 停顿 时 
间 ， 而 Parallel Scavenge 收 集 器 的 目标 则 是 达到 一 个 可 控制 的 吞吐 量 

Throughput) 。 所 谓 吞 吐 量 就 是 CPU 用 于 运行 用 户 代码 的 时 间 与 
CPU 总 消耗 时 间 的 比值 ， 即 吞吐 量 = 运行 用 户 代码 时 间 /〈 运 行 用 户 代 
码 时 间 + 垃 圾 收集 时 间 ) ， 虚 拟 机 总 共 运 行 了 100 分 钟 ， 其 中 垃圾 收集 
化 掉 1 分 钟 ， 那 否 吐 量 就 是 99% 。 


停顿 时 间 越 短 束 越 适合 需要 与 用 尸 交互 的 程序 ， 民 好 的 啊 应 速度 
能 提升 用 户 体 验 ， 而 高 否 吐 量 则 可 以 高 效率 地 利用 CPU 时 间 ， 尺 快 完 
成 程序 的 运算 任务 ， 主 要 适合 在 后 人 台 运 算 而 不 需要 太 多 交互 的 任务 。 


Parallel Scavenge 收 集 屡 提供 了 两 个 参数 用 于 精确 控制 吞吐 量 ， 分 
别 是 控制 最 大 垃圾 收集 停顿 时 间 的 -XX:MaxGCPauseMillis 参 数 以 及 直 
接 设 置 吞吐 量 大 小 的 -XX:GCTimeRatio 参 数 。 


MaxGCPauseMillis 参 数 允 许 的 值 是 一 个 大 于 0 的 宫 秒 数 ， 收 集 器 将 
尽 可 能 地 保证 内 存 回收 花费 的 时 间 不 超过 设 定 值 。 不 过 大 家 不 要 认为 
如 果 把 这 个 参数 的 值 设置 得 稍 小 一 点 就 能 使 得 系统 的 垃圾 收集 速度 变 
得 更 快 ，GC 停 顿时 间 缩 短 是 以 牺牲 吞吐 量 和 新 生 代 空间 来 换取 的 : 系 
统 把 新 生 代 调 小 一 些 ， 收 集 300MB 新 生 代 肯定 比 收集 500MB 快 吧 ， 这 
也 直接 导致 垃圾 收集 发 生得 更 频繁 一 些 ， 原 来 10 秒 收集 一 次 、 每 次 停 
顿 100 坚 秒 ， 现 在 变 成 5 秒 收集 一 次 、 每 次 停顿 70 毫 秒 。 停 顿时 间 的 确 
在 下 降 ， 但 吞吐 量 也 降下 来 了 。 


GCTimeRatio 参 数 的 值 应 当 是 一 个 大 于 0 且 小 于 100 的 整数 ， 也 就 
是 垃圾 收集 时 间 占 总 时 间 的 比率 ， 相 当 于 是 否 吐 量 的 倒数 。 如 果 把 此 
参数 设置 为 19， 那 允许 的 最 大 GC 时 间 就 占 总 时 间 的 59%6 〈 即 1/ 

(1+19) ) ， 默 认 值 为 99， 就 是 允许 最 大 1% ( 即 1/ (1+99) ) 的 垃圾 
收集 时 间 。 


由 于 与 吞吐 量 关 系 密切 ，Parallel Scavenge 收 集 右 也 经 常 称 为 “ 吞 
吐 量 优先 ” 收 集 絮 。 除 上 壕 两 个 参数 之 外 ，Parallel Scavenge 收 集 姨 还 
有 一 个 参数 -XX:+UseAdaptiveSizePolicy 值 得 关注。 这 是 一 个 开关 参 
数 ， 当 这 个 参数 打开 之 后 ， 就 不 需要 手工 指定 新 生 代 的 大 小 (- 
Xmn) 、Eden 与 Survivor 区 的 比例 (-XX:SurvivorRatio) 、 晋 升 老年 代 
对 象 年 龄 (-XX:PretenureSizeThreshold) 等 细节 参数 了 ， 虚 拟 机 会 根 


据 当 前 系统 的 运行 情况 收集 性 能 监控 信息 ， 动 态 调 整 这 些 参数 以 提供 


最 合适 的 停顿 时 间或 者 最 大 的 吞吐 量 ， 这 种 调节 方式 称 为 GC 自 适应 的 
调节 策略 (GC Ergonomics) (1 。 如 果 读 者 对 于 收集 器 运作 原来 不 太 了 
解 ， 手 工 优化 存在 困难 的 时 候 ， 使 用 Parallel Scavenge 收 集 器 配合 自 适 
应 调节 策略 ， 把 内 存 管 理 的 调 优 任务 交 给 虚拟 机 去 完成 将 是 一 个 不 错 
的 选择 。 只 需要 把 基本 的 内 存 数据 设置 好 (如 -Xmx 设 置 最 大 堆 ) ， 然 
后 使 用 MaxGCPauseMillis 参 数 (更 关注 最 大 停顿 时 间 ) 或 
GCTimeRatio 〈 更 关注 吞吐 量 ) 参数 给 虚拟 机 设立 一 个 优化 目标 ， 那 
具体 细节 参数 的 调节 工作 就 由 虚拟 机 完成 了 。 自 适应 调节 策略 也 是 
Parallel Scavenge 收 集 器 与 ParNew 收 集 器 的 一 个 重要 区 别 。 


[1] 官 方 介绍 : http://download.oracle.com/javase/1.5.0/docs/guide/vm/gc- 


ergonomics.html ° 


3.5.4 ”Serial Old 收集 器 


Serial Old 是 Serial 收 集 器 的 老年 代 版 本 ， 它 同样 是 一 个 单线 程 收集 
器 ， 使 用 “标记 -整理 ”算法 。 这 个 收集 器 的 主要 意义 也 是 在 于 给 Client 模 
式 下 的 虚拟 机 使 用 。 如 果 在 Server 模 式 下 ， 那 么 它 主要 还 有 两 大 用 途 : 
ee 
使 用 凯 ， 另 一 种 用 途 就 是 作为 CMS 收 集 器 的 后 备 预案 ， 在 并 发 收集 发 
生 Concurrent Mode Failure 时 使 用 。 这 两 点 都 将 在 后 面 的 内 容 中 详细 讲 
解 。Serial Old 收 集 右 的 工作 过 程 如 图 3-8 所 示 。 


用 户 斌 程 1 
CPU 0 
CPU 1 用 户 线程 2 
CPU 2 用 户 线程 3 新 生 代 采取 复制 算 法 者 年 代 采 取 标 记 - 墓 理 算 法 
用 户 线程 4 暂停 所 有 用 户 线程 暂停 所 有 用 户 绑 程 
CPU 3 


图 3-8 ”Serial/Serial Old 收集 器 运行 示意 图 
[1] 需 要 说 明 一 下 ，Parallel Scavenge 收 集 器 架构 中 本 身 有 PS MarkSweep 
收集 器 来 进行 老年 代 收 集 ， 并 非 直接 使 用 了 Serial Old 收集 器 ， 但 是 这 
个 PS MarkSweep 收 集 器 与 Serial Old 的 实现 非常 接近 ， 所 以 在 官方 的 许 
多 资料 中 都 是 直接 以 Serial Old 代替 PS MarkSweep 进 行 讲 解 ， 这 里 笔者 
也 采用 这 种 方式 。 


3.5.5 ”Parallel Old 收 集 器 


Parallel Old 是 Parallel Scavenge 收 集 絮 的 老年 代 版 本 ， 使 用 多 线程 
和 “标记 -整理 算法。 这 个 收集 器 是 在 JDK 1.6 中 才 开 始 提 供 的 ， 在 此 之 
前 ， 新 生 代 的 Parallel Scavenge 收 集 器 一 直 处 于 比较 槛 雁 的 状态 。 原 因 
是 ， 如 果 新 生 代 选择 了 Parallel Scavenge 收 集 器 ， 老 年 代 除 了 Serial Old 

(PS MarkSweep) 收集 器 外 别 无 选择 (还 记得 上 面 说 过 Parallel 

Scavenge 收 集 器 无 法 与 CMS 收集 器 配合 工作 吗 ? ) 。 由 于 老年 代 Serial 
Old 收集 器 在 服务 端 应 用 性 能 上 的 “拖累 "， 使 用 了 Parallel Scavenge 收 集 
器 也 未 必 能 在 整体 应 用 上 获得 吞吐 量 最 大 化 的 效果 ， 由 于 单线 程 的 老 
年 代 收 集中 无 法 充分 利用 服务 器 多 CPU 的 处 理 能 力 ， 在 老年 代 很 大 而 
且 硬 件 比 较 高 级 的 环境 中 ， 这 种 组 合 的 吞吐 量 甚至 还 不 一 定 有 ParNew 
加 CMS 的 组 合 “ 给 力 ” 


直到 Parallel Old 收集 器 出 现 后 , “吞吐 量 优 移 ? 收 集 历 终于 有 了 比较 
名 副 其 实 的 应 用 组 合 ， 在 注重 吞吐 量 以 及 CPU 资源 敏感 的 场合 ， 都 可 
以 优先 考虑 Parallel Scavenge 加 Parallel Old 收集 器 。Parallel Old 收集 器 的 
工作 过 程 如 图 3-9 所 示 。 


Safepoint SaFfepoint 


Parallel Scavenge/Parallel Old 收 集 絮 运行 


图 
示意 


3.5.6 ”CMS 收集 器 


CMS (Concurrent Mark Sweep) 收集 器 是 一 种 以 获取 最 短 回 收 停 
顿时 间 为 目标 的 收集 器 。 目 前 很 大 一 部 分 的 Java 应 用 集中 在 互联 网 站 或 
者 B/S 系统 的 服务 端 上 ， 这 类 应 用 尤其 重视 服务 的 响应 速度 ， 希 望 系统 
停顿 时 间 最 短 ， 以 给 用 户 带 来 较 好 的 体验 。CMS 收 集 器 就 非常 符合 这 
类 应 用 的 需求 。 


从 名 字 〈 包 含 "Mark Sweep") 上 就 可 以 看 出 ，CMS 收 集 器 是 基 
于 “标记 一 消除 ”算法 实现 的 ， 它 的 运作 过 程 相对 于 前 面 几 种 收集 右 来 
说 更 复杂 一 些 ， 整 个 过 程 分 为 4 个 步 怠 ， 包 括 : 


初始 标记 (CMS initial mark) 

并 发 标记 (CMS concurrent mark) 
重新 标记 (CMS remark) 

并 发 清除 (CMS concurrent sweep) 


其 中 ， 初 始 标记 、 重 新 标记 这 两 个 步 又 仍然 需要 "Stop The 
World"。 初 始 标 记 仅仅 只 是 标记 一 下 GC Roots 能 直接 关联 到 的 对 象 ， 速 
度 很 快 ， 并 发 标记 阶段 束 是 进行 GC RootsTracing 的 过 程 ， 而 重新 标记 
阶段 则 是 为 了 修正 并 发 标记 期 间 因 用 户 程序 继续 运作 而 导致 标记 产生 


变动 的 那 一 部 分 对 象 的 标记 记录 ， 这 个 阶段 的 停顿 时 间 一 般 会 比 初 始 
标记 阶段 稍 长 一 些 ， 但 远 比 并 发 标记 的 时 间 短 。 


由 于 整个 过 程 中 耗 时 最 长 的 并 发 标记 和 并 发 清除 过 程 收 集 郝 线程 
都 可 以 与 用 户 线 程 一 起 工作 ， 所 以 ， 从 忌 体 上 来 说 ，CMS 收 集 右 的 内 
存 回 收 过 程 是 与 用 户 线程 一 起 并 发 执行 的 。 通 过 图 3-10 可 以 比较 清楚 地 
看 到 CMS 收 集 器 的 运作 步 又 中 并 发 和 需要 停顿 的 时 间 。 


CPU0 用 户 线程 1 | 用 户 线程 1 三 : 用 户 线程 1 用 户 线程 

CPU 1 用 户 线程 2 i 用 户 线程 2 i 用 户 线程 2 用 户 线程 2 

CPU 2 用 户 线程 3 基点 二 这 se | 六 在 法 三 < 和 > 下 宇和 

CPU3 用 户 线程 4 用 户 线 程 4 1 用 户 线 程 4 用 户 线程 3 
afepoint Safepoint Saf' int 
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图 3-10 ”Concurrent Mark Sweep 收 集 絮 运行 示意 图 


CMS 是 一 款 优 秀 的 收集 器 ， 它 的 主要 优点 在 名 字 上 已 经 体现 出 来 
了 : 并 发 收集 、 低 停顿 ，Sun 公 司 的 一 些 官方 文档 中 也 称 之 为 并 发 低 停 
顿 收集 器 (Concurrent Low Pause Collector) 。 但 是 CMS 还 远 达 不 到 完 


美的 程度 ， 它 有 以 下 3 个 明显 的 缺点 : 


CMS 收 集 器 对 CPU 资 源 非 常 敏 感 。 其实， 面向 并 发 设计 的 程序 都 
对 CPU 资源 比较 敏感 。 在 并 发 阶段 ， 它 虽然 不 会 导致 用 户 线程 停顿 ， 
但 是 会 因为 占用 了 一 部 分 线程 〈 或 者 说 CPU 资源 ) 而 导致 应 用 程序 变 
慢 ， 总 吞吐 量 会 降低 。CMS 默 认 局 动 的 回收 线程 数 是 《CPU 数量 
+3) /4， 也 就 是 当 CPU 在 4 个 以 上 时 ， 并 发 回收 时 垃圾 收集 线程 不 少 于 


259% 的 CPU 资源 ， 并 且 随 着 CPU 数量 的 增加 而 下 降 。 但 是 当 CPU 不 足 4 
个 ( 壁 如 2 个 ) 时 ，CMS 对 用 户 程 序 的 影响 就 可 能 变 得 很 大 ， 如 果 本 来 
CPU 负 载 束 比 较 大 ， 还 分 出 一 半 的 运算 能 力 去 执行 收集 器 线程 ， 就 可 

能 导致 用 户 程序 的 执行 速度 忽然 降低 了 50%， 其 实 也 让 人 无 法 接受 。 为 
了 应 付 这 种 情况 ， 虚 拟 机 提供 了 一 种 称 为 “ 增 量 式 并 发 收集 

器 ” (Incremental Concurrent Mark Sweep/i-CMS) 的 CMS 收集 器 变种 ， 

所 做 的 事情 和 单 CPU 年 代 PC 机 操作 系统 使 用 抢占 式 来 模拟 多 任务 机 制 
的 思想 一 样 ， 就 是 在 并 发 标记 、 清 理 的 时 候 让 GC 线程 、 用 户 线程 交替 
运行 ， 尽 量 减少 GC 线程 的 独占 资源 的 时 间 ， 这 样 整 个 坪 圾 收集 的 过 程 
会 更 长 ， 但 对 用 户 程序 的 影响 束 会 显得 少 一 些 ， 也 就 是 速度 下 降 没 有 

那么 明显 。 实 践 证 明 ， 增 量 时 的 CMS 收 集 器 效果 很 一 般 ， 在 目前 版 本 
中 ，i-CMS 已 经 被 声明 为 "deprecated"， 即 不 再 提倡 用 户 使 用 。 


CMS 收集 器 无 法 处 理 浮动 垃圾 (Floating Garbage) ， 可 能 出 
现 "Concurrent Mode Failure" 失 败 而 导致 另 一 次 Full GC 的 产生 。 由 于 
CMS 并 发 清理 阶段 用 户 线程 还 在 运行 着 ， 伴 随 程序 运行 目 然 就 还 会 
新 的 垃圾 不 断 产 生 ， 这 一 部 分 垃圾 出 现在 标记 过 程 之 后 ，CMS 无 法 在 
当 次 收集 中 处 理 掉 它 们 ， 只 好 留待 下 一 次 GC 时 再 清理 掉 。 这 一 部 分 垃 
圾 就 称 为 “浮动 垃圾 ”。 也 是 由 于 在 垃圾 收集 阶段 用 户 线程 还 需要 运 
行 ， 那 也 惑 还 需要 预 留 有 足够 的 内 存 空间 给 用 户 线程 使 用 ， 因 此 CMS 
收集 右 不 能 像 其 他 收集 器 那样 等 到 老年 代 几 乎 完全 被 填 满 了 再 进行 收 
集 ， 需 要 预 留 一 部 分 空间 提供 并 发 收集 时 的 程序 运作 使 用 。 在 JDK 1.5 


的 默认 设置 下 ，CMS 收 集 器 当 老 年 代 使 用 了 68% 的 空间 后 就 会 被 激 
活 ， 这 是 一 个 偏 保守 的 设置 ， 如 果 在 应 用 中 老年 代 增长 不 是 太 快 ， 可 
以 适当 调 高 参数 -XX:CMSInitiatingOccupancyFraction 的 值 来 提高 触发 百 
分 比 ， 以 便 降 低 内 存 回收 次 数 从 而 获取 更 好 的 性 能 ， 在 JDK 1.6 中 ， 
CMS 收集 器 的 启动 阔 值 已 经 提升 至 92%。 要 是 CMS 运行 期 间 预 留 的 内 
存 无 法 满足 程序 需要 ， 就 会 出 现 一 次 "Concurrent Mode Failure" 失败， 
这 时 虚拟 机 将 启动 后 备 预案 临时 启用 Serial Old 收集 器 来 重新 进行 老 
年 代 的 垃圾 收集 ， 这 样 停顿 时 间 就 很 长 了 。 所 以 说 参数 -XX:CM 
SImitiatingOccupancyFraction 设 置 得 太 高 很 容易 导致 大 量 "Concurrent 


Mode Failure" 失 败 ， 性 能 反而 降低 。 


还 有 最 后 一 个 缺点 ， 在 本 节 开 头 说 过 ，CMS 是 一 款 基 于 “标记 一 清 
除 ” 算 法 实现 的 收集 器 ， 如 果 读 者 对 前 面 这 种 算法 介绍 还 有 印象 的 话 ， 
就 可 能 想到 这 意味 着 收集 结束 时 会 有 大 量 空间 碎片 产生 。 空 间 碎片 过 
多 时 ， 将 会 给 大 对 象 分 配 带 来 很 大 麻烦 ， 往 往 会 出 现 老年 代 还 有 很 大 
空间 剩余 ， 但 是 无 法 找到 足够 大 的 连续 空间 来 分 配 当前 对 象 ， 不 得 不 
提前 触发 一 次 Full GC。 为 了 解决 这 个 问题 ，CMS 收 集 器 提供 了 一 个 - 
XX:+UseCMSCompactAtFullCollection 开 关 参 数 (默认 就 是 开启 的 ) ， 
用 于 在 CMS 收集 器 顶 不 住 要 进行 FullGC 时 开启 内 存 碎片 的 合并 整理 过 
程 ， 内 存 整理 的 过 程 是 无 法 并 发 的 ， 空 间 碎 片 问 题 没 有 了 ， 但 停顿 时 
间 不 得 不 变 长 。 虚 拟 机 设计 者 还 提供 了 另外 一 个 参数 - 
XX:CMSFullGCsBeforeCompaction， 这 个 参数 是 用 于 设置 执行 多 少 次 不 


压缩 的 Full GC 后 ， 跟 着 来 一 次 带 压缩 的 (默认 值 为 0， 表 示 每 次 进入 
Full GC 时 都 进行 碎片 整理 ) 


3.5.7 ”G1 收集 器 


G1 (Garbage-First) 收集 句 是 当今 收集 兹 技术 发 展 的 最 前 沿 成 果 之 
一 ， 早 在 JDK 1.7 刚 刚 确 立项 目 目标 ，Sun 公 司 给 出 的 JDK 1.7 RoadMap 
里 面 ， 它 就 被 视 为 JDK 1.7 中 HotSpot 虚 拟 机 的 一 个 重要 进化 特征 。 从 
JDK 6u14 中 开始 就 有 Early Access 版 本 的 G1 收集 器 供 开发 人 员 实 验 、 试 
用 ， 由 此 开始 G1 收集 器 的 "Experimental" 状 态 持续 了 数 年 时 间 ， 直 至 
JDK 7u4，Sun 公 司 才 认为 它 达到 足够 成 熟 的 商用 程度 ， 移 除 


了 "Experimental" 的 标识 。 


G1 走 一 秩 面 癌 服 务 端 应 用 的 垃圾 收集 郁 。HotSpot 开 发 团队 赋予 它 
的 使 命 是 (在 比较 长 期 的 ) 未 来 可 以 替换 掉 JDK 1.5 中 发 布 的 CMS 收集 
吉 。 与 其 他 GC 收 集 万 相 比 ，G1 上 具备 如 下 特点 。 


并 行 与 并 发 : G1 能 充分 利用 多 CPU、 多 核 环境 下 的 硬件 优势 ， 使 
用 多 个 CPU 《CPU 或 者 CPU 核心 ) 来 缩短 Stop-The-World 停 顿 的 时 间 ， 
部 分 其 他 收集 器 原本 需要 停顿 Java 线 程 执 行 的 GC 动作 ，G1 收 集 器 仍然 
可 以 通过 并 发 的 方式 让 Java 程 序 继续 执行 。 


分 代 收 集 : 与 其 他 收集 器 一 样 ， 分 代 概 念 在 G1 中 依然 得 以 保留 。 
虽然 G1 可 以 不 需要 其 他 收集 器 配合 就 能 独立 管理 整个 GC 堆 ， 但 它 能 够 


采用 不 同 的 方式 去 处 理 新 创建 的 对 象 和 已 经 存活 了 一 段 时 间 、 熬 过 多 
次 GC 的 旧 对 象 以 获取 更 好 的 收集 效果 。 


空间 整合 : 与 CMS 的 “标记 一 清理 ”算法 不 同 ，G1 从 整体 来 看 是 基 
于 “标记 一 整理 ”算法 实现 的 收集 器 ， 从 局 部 (两 个 Region 之 间 ) 上 来 看 
是 基于 “复制 "算法 实现 的 ， 但 无 论 如何 ， 这 两 种 算法 都 意味 着 G1 运作 
期 间 不 会 产生 内 存 空间 碎片 ， 收 集 后 能 提供 规整 的 可 用 内 存 。 这 种 特 
性 有 利于 程序 长 时 间 运 行 ， 分配 大 对 象 时 不 会 因为 无 法 找到 连续 内 存 
空间 而 提前 触发 下 一 次 GC 。 


可 预测 的 停顿 ， 这 是 G1 相对 于 CMS 的 男 一 大 优势 ， 降 低 停 顿时 间 
是 G1 和 CMS 共同 的 关注 点 ， 但 G1 除 了 追求 低 停顿 外 ， 还 能 建立 可 预测 
的 停顿 时 间 模 型 ， 能 让 使 用 者 明确 指定 在 一 个 长 度 为 M 毫 秒 的 时 间 卢 
段 内 ， 消 耗 在 垃圾 收集 上 的 时 间 不 得 超过 N 毫 秒 ， 这 几乎 已 经 是 实时 
Java (RTSJ) 的 垃圾 收集 器 的 特征 了 。 


在 G1 之 前 的 其 他 收集 占 进 行 收集 的 范围 痢 是 整个 新 生 代 或 者 老年 
代 ， 而 G1 不 再 是 这 样 。 使 用 G1 收集 此 时 ，Java 堆 的 内 存 布局 整 与 其 他 
收集 器 有 很 大 差别 ， 它 将 整个 Java 堆 划分 为 多 个 大 小 相等 的 独立 区 域 
(Region) ， 虽 然 还 保留 有 新 生 代 和 老年 代 的 概念 ， 但 新 生 代 和 老年 
代 不 再 是 物理 隔离 的 了 ， 它 们 都 是 一 部 分 Region (不 需要 连续 ) 的 集 


A 


G1 收 集 器 之 所 以 能 建立 可 预测 的 停顿 时 间 模 型 ， 征 因为 它 可 以 有 
计划 地 避免 在 整个 Java 堆 中 进行 全 区 域 的 垃圾 收集 。G1 跟 踪 各 个 
Region 里 面 的 垃圾 堆积 的 价值 大 小 (回收 所 获得 的 空间 大 小 以 及 回收 
所 需 时 间 的 经 验 值 ) ， 在 后 台 维 护 一 个 优先 列表 ， 每 次 根据 允许 的 收 
集 时 间 ， 优 先 回收 价值 最 大 的 Region (这 也 就 是 Garbage-First 名 称 的 来 
由 ) 。 这 种 使 用 Region 划 分 内 存 空间 以 及 有 优先 级 的 区 域 回收 方式 ， 
保证 了 G1 收集 器 在 有 限 的 时 间 内 可 以 获取 尽 可 能 高 的 收集 效率 。 


G1 把 内 存 “ 化 整 为 零 ”的 思路 ， 理 解 起 来 似乎 很 容易 ， 但 其 中 的 实 
现 细节 却 远 远 没有 想象 中 那样 簿 单 ， 否 则 也 不 会 从 2004 年 Sun 实 难 室 发 
表 第 一 篇 G1 的 论文 开始 直到 今天 (将 近 10 年 时 间 ) 才 开 发 出 G1 的 商用 
版 。 笔 者 以 一 个 细节 为 例 : 把 Java 堆 分 为 多 个 Region 后 ， 垃 圾 收集 是 否 
就 真 的 能 以 Region 为 单位 进行 了 ? 听 起 来 顺理成章 ， 再 仔细 想 想 就 很 
容易 发 现 问题 所 在 : Region 不 可 能 是 孤立 的 。 一 个 对 象 分 配 在 某 个 
Region 中 ， 它 并 非 只 能 被 本 Region 中 的 其 他 对 象 引 用 ， 而 是 可 以 与 整个 
Java 扒 任意 的 对 象 发 生 引用 关系 。 那 在 做 可 达 性 判定 确定 对 象 是 否 存 活 
的 时 候 ， 纪 不 是 还 得 扫描 整个 Java 堆 才能 保证 准确 性 ? 这 个 问题 其 实 并 
非 在 G1 中 才 有 ， 只 是 在 G1 中 更 加 突出 而 已 。 在 以 前 的 分 代 收集 中 ， 新 
生 代 的 规模 一 般 都 比 老年 代 要 小 许多 ， 新 生 代 的 收集 也 比 老年 代 要 频 
繁 许多 ， 那 回收 新 生 代 中 的 对 象 时 也 面临 相同 的 问题 ， 如 果 回 收 新 生 
代 时 也 不 得 不 同时 扫 拉 老年 代 的 话 ， 那 么 Minor GC 的 效率 可 能 下 降 不 


少 。 


在 G1 收集 器 中 ，Region 之 间 的 对 和 象 引用 以 及 其 他 收集 器 中 的 新 生 
代 与 老年 代 之 间 的 对 象 引 用 ， 虚 拟 机 都 是 使 用 Remembered Set 来 避免 全 
堆 扫 摘 的 。G1 中 每 个 Region 都 有 一 个 与 之 对 应 的 Remembered Set， 虚 
拟 机 发 现 程序 在 对 Reference 类 型 的 数据 进行 写 操 作 时 ， 会 产生 一 个 
Write Barrier 暂 时 中 断 写 操作 ， 检 查 Reference 引 用 的 对 象 是 否 处 于 不 同 
的 Region 之 中 〈 在 分 代 的 例子 中 就 是 检查 是 否 老 年 代 中 的 对 象 引 用 了 
新 生 代 中 的 对 象 ) ， 如 果 是 ， 便 通过 CardTable 把 相关 引用 信息 记录 到 
被 引用 对 象 所属 的 Region 的 Remembered Set 之 中 。 当 进行 内 存 回 收 时 ， 
在 GC 根 节点 的 枚 举 范 围 中 加 入 Remembered Set 即 可 保证 不 对 全 堆 扫 描 
也 不 会 有 址 汕 。 


如 果 不 计 算 维 护 Remembered Set 的 操作 ，G1 收 集 器 的 运作 大 致 可 
划分 为 以 下 几 个 步 又 : 


初始 标记 (Initial Marking) 
并 发 标记 (Concurrent Marking) 
最 终 标记 (Final Marking) 


筷 选 回收 (Live Data Counting and Evacuation ) 


对 CMS 收 集 器 运作 过 程 熟悉 的 读者 ， 一 定 已 经 发 现 G1 的 前 儿 个 步 
又 的 运作 过 程 和 CMS 有 很 多 相似 之 处 。 初 始 标记 阶段 仅仅 只 是 标记 一 


下 GC Roots 能 直接 关联 到 的 对 象 ， 并 且 修 改 TAMS (Next Top at Mark 
Start) 的 值 ， 让 下 一 阶段 用 户 程序 并 发 运行 时 ， 能 在 正确 可 用 的 Region 
中 创建 新 对 象 ， 这 阶段 需要 停顿 线程 ， 但 耗 时 很 得。 并 发 标记 阶段 是 
从 GC Root 开始 对 堆 中 对 象 进行 可 达 性 分 析 ， 找 出 存活 的 对 象 ， 这 阶段 
耗 时 较 长 ， 但 可 与 用 户 程序 并 发 执行 。 而 最 终 标记 阶段 则 是 为 了 修正 
在 并 发 标记 期 间 因 用 户 程序 继续 运作 而 导致 标记 产生 变动 的 那 一 部 分 
标记 记录 ， 虚 拟 机 将 这 段 时 间 对 象 变化 记录 在 线程 Remembered Set 
Logs 里 面 ， 最 终 标记 阶段 需要 把 Remembered Set Logs 的 数据 合并 到 
Remembered Set 中 ， 这 阶段 需要 停顿 线程 ， 但 是 可 并 行 执 行 。 最 后 在 入 
选 回收 阶段 首先 对 各 个 Region 的 回收 价值 和 成 本 进行 排序 ， 根 据 用 户 
所 期 望 的 GC 集 顿 时 间 来 制定 回收 计划 ， 从 Sun 公 司 透 露出 来 的 信息 来 
看 ， 这 个 阶段 其 实 也 可 以 做 到 与 用 户 程序 一 起 并 发 执行 ， 但 是 因为 只 
回收 一 部 分 Region， 时 间 是 用 户 可 控制 的 ， 而 且 停 顿 用 户 线程 将 大 幅 
提高 收集 效率 。 通 过 图 3-11 可 以 比较 清楚 地 看 到 G1 收 集 器 的 运作 步骤 
中 并 发 和 需要 停顿 的 阶段 。 


CPUD 用 已 线程 1 用 户 线 程 1 用 尸 线程 1 
CPU 1 用 户 线程 2 i 用 户 线程 2 用 中 线程 2 
CPU 2 用 户 线程 3 用 尸 线 程 3 
CPU3 用 户 线 程 4 用 户 线程 4 用 户 线 程 4 


Safepoint Safepoint Safepoint Safepoint 


由 于 目前 G1 成 熟 版 本 的 发 布 时 间 还 很 短 ，G1 收 集 句 几乎 可 以 说 还 
没有 经 过 实际 应 用 的 考验 ， 网 络 上 关于 G1 收集 器 的 性 能 测试 也 非常 贫 
乏 ， 到 目前 为 止 ， 笔者 还 没有 搜索 到 有 关 的 生产 环境 下 的 性 能 测试 报 
告 。 强 调 “ 生 产 环境 下 的 测试 报告 ”是 因为 对 于 垃圾 收集 器 来 说 ， 仅 仅 
通过 简单 的 Java 代 码 写 个 Microbenchmark 程 序 来 创建 、 移 除 Java 对 象 ， 
再 用 -XX:+PrintGCDetails 等 参数 来 查看 GC 日 志 是 很 难 做 到 准确 衡量 其 
性 能 的 。 因 此 ， 关 于 G1 收集 器 的 性 能 部 分 ， 笔 者 引用 了 Sun 实 验 室 的 论 
文 《Garbage-First Garbage Collection》 中 的 一 段 测 试 数据 。 


Sun 给 出 的 Benchmark 的 执行 硬件 为 Sun V880 服 务 器 (8x750MHz 
UltraSPARC III CPU、32G 内 存 、Solaris 10 操 作 系统 ) 。 执 行 软件 有 两 
个 ， 分 别 为 SPECjbb (模拟 商业 数据 库 应 用 ， 堆 中 存活 对 象 约 为 
165MB， 结 果 反 映 吐 量 和 最 长 事务 处 理 时间 ) 和 telco (模拟 电话 应 答 
服务 应 用 ， 堆 中 存活 对 象 约 为 100MB， 结 果 反 映 系统 能 支持 的 最 大 吞 
吐 量 ) 。 为 了 便于 对 比 ， 还 收集 了 一 组 使 用 ParNew+CMS 收 集 器 的 测 
试 数据 。 所 有 测试 都 配置 为 与 CPU 数 量 相 同 的 8 条 GC 线程 。 


在 反应 停顿 时 间 的 软 实时 目标 (Soft Real-Time Goal) 测试 中 ， 横 
向 是 两 个 测试 软件 的 时 间 片 段 配置 ， 单 位 是 毫秒 ， 以 (X/Y) 的 形式 表 
示 ， 代 表 在 Y 毫 秒 内 最 大 允许 GC 时 间 为 X 毫 秒 “对 于 CMS 收集 右 ， 无 
法 直接 指定 这 个 目标 ， 通 过 调整 分 代 大 小 的 方式 大 致 模拟 ) 。 纵 向 是 


两 个 软件 在 对 应 配置 和 不 同 的 Java 扒 容量 下 的 测试 结果 ，V9%、avgV9%6 
和 wV% 分 别 代表 的 含义 如 下 。 


V%: 表示 测试 过 程 中 ， 软 实时 目标 失败 的 概率 ， 软 实时 目标 失败 
即 茶 个 时 间 搬 段 中 实际 GC 时 间 超 过 了 允许 的 最 大 GC 时 间 。 


avgV9%: 表示 在 所 有 实际 GC 时 间 超 标的 时 间 片 段 里 ， 实 际 GC 时 间 
超过 最 大 GC 时 间 的 平均 百分比 (实际 GC 时 间 减 去 允许 最 大 GC 时 间 ， 
再 除 以 总 时 间 片 段 ) 。 


wV9%: 表示 在 测试 结果 最 差 的 时 间 片 段 里 ， 实 际 GC 时 间 占 用 执行 
时 间 的 百分比 。 


测试 结果 见 表 3-1 。 


表 3-1 测试 结果 


Benchmark/ Soft real-time goal compliance statistics by Heap Size 
SPECjbb 768M 
GI (100/200) 100.00% 1.68% | 10.94% 69.67% 


Gl (150/450) 6 % 1.53%| 3.28% 
GI (150/600) % 6 8.65% 
GI 6 0.72% 6 0.00% 


CMS (150,450) 5.72% | 28.19% | 100.00% 


Telco 640M 
Gl (50/100) 0.11% | 12.10% | 38.57% 
GI 9.15% 
GI (75/225) 2.07% 
GI (75/300) 2.91% 


0.44% 2.73% 


GI (100/400) 549 


从 表 3-1 所 示 的 结果 可 见 ， 对 于 telco 来 说 ， 软 实时 目标 失败 的 概率 
控制 在 0.5%~0.7% 之 间 ，SPECjbb 就 要 差 一 些 ， 但 也 控制 在 2%~5% 之 
间 ， 概 率 随 着 (X/Y) 的 比值 减 小 而 增加 。 另 一 方面 ， 失 败 时 超出 允许 
GC 时 间 的 比值 随 着 总 时 间 片 段 增加 而 变 小 (分 母 变 大 了 ) ,在 

(100/200) 、512MB 的 配置 下 ，G1 收 集 器 出 现 了 某 些 时 间 片 段 下 
100% 时 间 在 进行 GC 的 最 坏 情况 。 而 相 比 之 下 ，CMS 收 集 右 的 测试 结 
束 要 差 很 多 ，3 种 Java 堆 容量 下 都 出 现 了 1009% 时 间 进 行 GC 的 情况 。 


在 吞吐 量 测 试 中 ， 测 试 数据 取 3 次 SPECjbb 和 15 次 telco 的 平均 结 
如 图 3-12 所 示 。 在 SPECjbb 的 应 用 下 ， 各 种 配置 下 的 G1 收 集 釉 表 现 出 了 
一 致 的 行为 ， 吞 叶 量 看 起 来 只 与 允许 最 大 GC 时 间 成 正比 关系 ， 而 在 
telco 的 应 用 中 ， 不 同 配置 对 吞吐 量 的 影响 则 显得 很 微弱 。 与 CMS 收集 
器 的 吞吐 量 对 比 可 以 看 到 ， 在 SPECjbb 测 试 中 ， 在 堆 容量 超过 768MB 
时 ，CMS 收 集 絮 有 5%~10% 的 优势 ， 而 在 telco 测 试 中 ，CMS 的 优势 则 要 
小 一 些 ， 只 有 3%~4% 左 右 。 
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图 3-12 天 吐 量 测试 结 


在 更 大 规模 的 生产 环境 下 ， 笔 者 引用 一 段 在 StackOverflow.com 上 
看 到 的 经 验 与 读者 分 享 :“ 我 在 一 个 真实 的 、 较 大 规模 的 应 用 程序 中 使 
用 过 G1: 大 约 分 配 有 60~70GB 内 存 ， 存 活 对 象 大 约 在 20~50GB 之 间 。 
服务 器 运行 Linux 操 作 系 统 ，JDK 版 本 为 6u22。G1 与 PS/PS Old 相 比 ， 最 
大 的 好 处 是 停顿 时 间 更 加 可 控 、 可 预测 ， 如 果 我 在 PS 中 设置 一 个 很 低 
的 最 大 介 许 GC 时 间 ， 壁 如 期 望 50 富 秒 内 完成 GC (- 
XX:MaxGCPauseMillis=50) ， 但 在 65GB 的 Java 堆 下 有 可 能 得 到 的 直接 
结果 是 一 次 长 达 30 秒 至 2 分 钟 的 漫长 的 Stop-The-World 过 程 ， 而 G1 与 
CMS 相 比 ， 虽 然 它们 都 立足 于 低 停顿 时 间 ，CMS 仍 然 是 我 现在 的 选 
择 ， 但 是 随 着 Oracle 对 G1 的 持续 改进 ， 我 相信 G1 会 是 最 终 的 胜利 者 。 
如 果 你 现在 采用 的 收集 器 没有 出 现 问题 ， 那 就 没有 任何 理由 现在 去 选 
择 G1， 如 果 你 的 应 用 追求 低 停顿 ， 那 G1 现在 已 经 可 以 作为 一 个 可 党 试 
的 选择 ， 如 果 你 的 应 用 追求 吞吐 量 ， 那 G1 并 不 会 为 你 带 来 什么 特别 的 
好 


5 理 亿 GC 目光 


阅读 GC 日 志 古 处 理 Java 虚 拟 机 内 存 问 题 的 基础 拉 能 ， 它 只 是 一 些 
人 为 确定 的 规则 ， 没 有 太 多 技术 含量 。 在 本 书 的 第 1 版 中 没有 专门 讲解 
如 何 了 阅读 分 析 GC 日 志 ， 为 此 作者 收 到 许多 读者 来 信 ， 反 映 对 此 感到 困 
惑 ， 因 此 专门 增加 本 和 内 容 来 讲解 如 何 理解 GC 日 志 。 


每 一 种 收集 絮 的 日 志 形 式 都 是 由 它们 目 喘 的 实现 所 决定 的 ， 换 而 
言 之 ， 每 个 收集 右 的 日 志 格 式 都 可 以 不 一 样 。 但 虚拟 机 设计 者 为 了 方 
便 用 户 阅 读 ， 将 各 个 收集 器 的 日 志 痢 维持 一 定 的 共性 ， 例 如 以 下 两 段 
典型 的 GC 日 志 : 


33.125:[GC[DefNew:3324K- >152K (3712K) ,0.0025925 secs]3324K-> 
152K (11904K) ,0.0031680 secs] 


100.667:[Full GC[Tenured:0 K->210K (10240K) ， 
0.0149142secs]4603K- >210K (19456K) ，[Perm:2999K- >2999K (21248K) ]， 
0.0150007 secs]j[Times:user=0.01 sys=0.00, real=0.02 Secs] 


最 前 面 的 数字 “33.125: ”和 “100.667: ”代表 了 GC 发 生 的 时 间 ， 这 
个 数字 的 含义 是 从 Java 虚 拟 机 启动 以 来 经 过 的 秒 数 。 


GC 日 志 开 头 的 "[GC" 和 "[Full GC" 说 明了 这 次 垃圾 收集 的 停顿 类 
型 ， 而 不 是 用 来 区 分 新 生 代 GC 还 是 老年 代 GC 的 。 如 果 有 "Full"， 说 明 
这 次 GC 是 发 生 了 Stop-The-World 的 ， 例 如 下 面 这 上 段 新 生 代 收 集 器 
ParNew 的 日 志 也 会 出 现 "[Full GC" (这 一 般 是 因为 出 现 了 分 配 担保 失 


败 之 类 的 问题 ， 所 以 才 导 致 STW) 。 如 果 是 调用 System.gc() 方 法 所 触 
发 的 收集 ， 那 么 在 这 里 将 显示 "[Full GC (System) " 


[Full GC 283.736:[ParNew:261599K- >261599K (261952K) ，0.0000288 
secs|] 


接 下 来 的 "[DefNew"、"[Tenured"、"[Perm" 表 示 GC 发 生 的 区 域 ， 
这 里 显示 的 区 域名 称 与 使 用 的 GC 收集 名 是 密切 相关 的 ， 例 如 上 面 样 例 
所 使 用 的 Serial 收 集 絮 中 的 新 生 代 名 为 "Default New Generation"， 所 以 
显示 的 是 "[DefNew"。 如 果 是 ParNew 收 集 器 ， 新 生 代 名 称 就 会 变 为 " 
[ParNew"， 意 为 "Parallel New Generation"。 如 果 采 用 Parallel Scavenge 
收集 器 ， 那 它 配 套 的 新 生 代 称 为 "PSYoungGen"， 老 年 代 和 永久 代 同 
理 ， 名 称 也 是 由 收集 絮 决 定 的 。 


后 面 方 括号 内 部 的 "3324K->152K (3712K) "含义 是 “GC 前 该 内 
存 区 域 已 使 用 容量 -> GC 后 该 内 存 区 域 已 使 用 容量 (该 内 存 区 域 总 容 
量 ) ”。 而 在 方 括号 之 外 的 "3324K- > 152K (11904K) "表示 “GC 前 Java 
堆 已 使 用 容量 -> GC 后 Java 堆 已 使 用 容量 (Java 堆 总 容量 ) ”。 


再 往 后 ，"0.0025925 secs" 表 示 该 内 存 区 域 GC 所 占用 的 时 间 ， 单 位 
是 秒 。 有 的 收集 器 会 给 出 更 具体 的 时 间 数 据 ， 如 "[Times:user=0.01 
sys=0.00，real=0.02 secs]"， 这 里 面 的 user、sys 和 real 与 Linux 的 time 命 
令 所 输出 的 时 间 含 义 一 致 ， 分 别 代 表 用 户 态 消 耗 的 CPU 时 间 、 内 核 态 
消耗 的 CPU 事件 和 操作 从 开始 到 结束 所 经 过 的 墙 钟 时 间 (Wall Clock 


Time) 。CPU 时 间 与 墙 钟 时 间 的 区 别 是 ， 墙 钟 时 间 包 括 各 种 非 运算 的 
等 待 耗 时 ， 例 如 等 竺 磁盘/O、 等 待 线 程 胆 寨 ， 而 CPU 时 间 不 包括 这 些 
耗 时 ， 但 当 系 统 有 多 CPU 或 者 多 核 的 话 ， 多 线程 操作 会 营 加 这 些 CPU 
时 间 ， 所 以 读者 看 到 user 或 sys 时 间 超 过 real 时 间 是 完全 正常 的 。 


JDK 1.7 中 的 各 种 垃圾 收集 器 到 此 已 全 部 介绍 完毕 ， 在 


3.5.9” 拉 圾 收集 器 参数 总 结 


撒 立 
提 到 了 很 多 虚拟 机 非 稳定 的 运行 参数 ， 在 表 3-2 中 整理 了 这 些 参数 供 读 


者 实践 时 参考 。 


参 数 
UseSerialGC 


UseParNewGC 


UseConcMarkSweepGC 


UseParallelGC 


UseParallelOldGC 


表 3-2 垃圾 收集 相关 的 常用 参数 
描 述 

虚拟 机 运行 在 Client 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 使 用 Serial + 
Serial Old 的 收集 器 组 合 进行 内 存 回收 

打开 此 开关 后 ， 使 用 ParNew + Serial Old 的 收集 天 组 合 进 行内 存 回 收 

打开 此 开关 后 ， 使 用 ParNew + CMS + Serial Old 的 收集 器 组 合 进行 内 存 
回收 。Serial Old 收集 器 将 作为 CMS 收集 器 出 现 Concurrent Mode Failure 
失败 后 的 后 备 收集 器 使 用 

虚拟 机 运行 在 Server 模式 下 的 默认 值 ， 打 开 此 开关 后 ， 使 用 Parallel 
Scavenge + Serial Old (PS MarkSweep) 的 收集 器 组 合 进行 内 存 回收 

打开 此 开关 后 ， 使 用 Parallel Scavenge + Parallel Old 的 收集 器 组 合 进 行 
内 存 回 收 


SurvivorRatio 


PretenureSizeThreshold 


MaxTenuringThreshold 


UseAdaptiveSizePolicy 


HandlePromotionFailure 


ParallelGCThreads 


新 生 代 中 Eden 区 域 与 Survivor 区 域 的 容量 比值 ， 默 认为 8， 代 表 
Eden : Survivor=8 : 1 

直接 晋升 到 老年 代 的 对 象 大 小 ， 设 置 这 个 参数 后 ， 大 于 这 个 参数 的 对 象 
将 直接 在 老年 代 分 配 

晋升 到 老年 代 的 对 象 年 龄 。 每 个 对 象 在 坚持 过 一 次 Minor GC 之 后 ， 年 
龄 就 增加 1， 当 超过 这 个 参数 值 时 就 进入 老年 代 

动态 调整 Java 堆 中 各 个 区 域 的 大 小 以 及 进入 老年 代 的 年 龄 

是 否 允许 分 配 担保 失败 ， 即 老年 代 的 剩余 空间 不 足以 应 付 新 生 代 的 整个 
Eden 和 Survivor 区 的 所 有 对 象 都 存活 的 极端 情况 

设置 并 行 GC 时 进行 内 存 回收 的 线程 数 


参 数 
GCTimeRatio 
MaxGCPauseMillis 


CMSInitiatingOccupancyFraction 


UseCMSCompactAtFullCollection 


CMSFullGCsBeforeCompaction 


( 续 ) 


描 述 

GC 时 间 占 总 时 间 的 比率 ， 默 认 值 为 99， 即 允许 1% 的 GC 时 间 。 仅 在 
使 用 Parallel Scavenge 收集 器 时 生效 

设置 GC 的 最 大 停顿 时 间 。 仅 在 使 用 Parallel Scavenge 收集 器 时 生效 

设置 CMS 收集 器 在 老年 代 空 间 被 使 用 多 少 后 触发 垃圾 收集 。 默 认 值 为 
68%， 仅 在 使 用 CMS 收集 器 时 生效 

设置 CMS 收集 器 在 完成 垃圾 收集 后 是 否 要 进行 一 次 内 存 碎片 整理 。 仅 
在 使 用 CMS 收集 器 时 生效 

设置 CMS 收集 器 在 进行 若干 次 垃圾 收集 后 再 启动 一 次 内 存 碎 片 整 理 。 
仅 在 使 用 CMS 收集 器 时 生效 


3.6 ”内 存 分 配 与 回收 蛇 略 


Java 技 术 体系 中 所 提倡 的 目 动 内 存 管理 最 终 可 以 归结 为 目 动 化 地 
解决 了 两 个 问题 ， 给 对 象 分 配 内 存 以 及 回收 分 配给 对 象 的 内 存 。 关 于 
回收 内 存 这 一 点 ， 我 们 已 经 使 用 了 大 量 篇 幅 去 介绍 虚拟 机 中 的 垃圾 收 
集 絮 体系 以 及 运作 原理 ， 现 在 我 们 再 一 起 来 探讨 一 下 给 对 和 象 分 配 内 存 
鸭 那 总 于 外 


对 象 的 内 存 分 配 ， 往 大 方向 讲 ， 就 是 在 堆 上 分 配 (但 也 可 能 经 过 
JIT 编 译 后 被 拆散 为 标量 类 型 并 间接 地 栈 上 分 配 趾 ) ， 对 象 主要 分 配 在 
新 生 代 的 Eden 区 上 ， 如 采 局 动 了 本 地 线程 分 配 缓冲 ， 将 按 线程 优先 在 
TLAB 上 分 配 。 人 少数 情况 下 也 可 能 会 直接 分 配 在 老年 代 中 ， 分 配 的 规 
则 并 不 是 百分之百 固定 的 ， 其 细节 取决 于 当前 使 用 的 是 哪 一 种 垃圾 收 
集 絮 组 合 ， 还 有 虚拟 机 中 与 内 存 相关 的 参数 的 设置 。 


接 下 来 我 们 将 会 讲解 几 条 最 普遍 的 内 存 分 配 规 则 ， 并 通过 代码 去 
验证 这 些 规 则 。 本 市 下 面 的 代码 在 测试 时 使 用 Client 模 式 虚 拟 机 运行 ， 
没有 手工 指定 收集 右 组 合 ， 换 人 句 话说 ， 验 证 的 十 在 使 用 Serial/Serial 
Old 收 集 器 下 (ParNew/Serial Old 收集 器 组 合 的 规则 也 基本 一 致 ) 的 内 
存 分 配 和 回收 的 策略 。 读 者 不 妨 根 据 目 己 项 目 中 使 用 的 收集 器 写 一 些 
程序 去 验证 一 下 使 用 其 他 几 种 收集 絮 的 内 存 分 配 俩 上 略 。 


3.6.1 对象 优 先 在 Eden 分 配 


大 多 数 情 况 下 ， 对 象 在 狐 生 代 Eden 区 中 分 配 。 当 Eden 区 没有 足够 
空间 进行 分 配 时 ， 虚 拟 机 将 发 起 一 次 Minor GC 。 


虚拟 机 提供 了 -XX:+PrintGCDetails 这 个 收集 器 日 志 参 数 ， 告 诉 虚 
拟 机 在 发 生 垃圾 收集 行为 时 打印 内 存 回 收 日 志 ， 并 且 在 进程 退出 的 时 
候 输 出 当前 的 内 存 各 区 域 分 配 情况 。 在 实际 应 用 中 ， 内 存 回收 日 志 一 
般 是 打印 到 文件 后 通过 日 志 工 具 进 行 分 析 ， 不 过 本 实验 的 日 志 并 不 


多 ， 直 接 阅 读 就 能 看 得 很 清楚 。 


代码 清单 3-5 的 testAllocation() 方 法 中 ， 党 试 分 配 3 个 2MB 大 小 和 1 
个 4MB 大 小 的 对 象 ， 在 运行 时 通过 -Xms20M 、-Xmx20M 、-Xmn10M 
这 3 个 参数 限制 了 Java 堆 大 小 为 20MB， 不 可 扩展 ， 其 中 10MB 分 配给 新 
生 代 ， 剩 下 的 10MB 分 配给 老年 代 。-XX:SurvivorRatio=8 决 定 了 新 生 代 
中 Eden 区 与 一 个 Survivor 区 的 空间 比例 是 8:1， 从 输出 的 结果 也 可 以 清 
晰 地 看 到 "eden space 8192K、from space 1024K、to space 1024K" 的 信 
息 ， 新 生 代 总 可 用 空间 为 9216KB (Eden 区 +1 个 Survivor 区 的 总 容 
) 


wl 


执行 testAllocation() 中 分 配 allocation4 对 象 的 语句 时 会 发 生 一 次 
Minor GC， 这 次 GC 的 结果 是 新 生 代 6651KB 变 为 148KB， 而 总 内 存 占 
用 量 则 几乎 没有 减少 (因为 allocation1、allocation2、allocation3 三 个 对 


象 都 是 存活 的 ， 虚 拟 机 几乎 没有 找到 可 回收 的 对 象 ) 。 这 次 GC 发 生 的 
原因 是 给 allocation4 分 配 内 存 的 时 候 ， 发 现 Eden 已 经 被 占用 了 6MB， 
剩余 空间 已 不 足以 分 配 allocation4 所 需 的 4MB 内 存 ， 因 此 发 生 Minor 
GC。GC 期 间 虚 拟 机 又 发 现 已 有 的 3 个 2MB 大 小 的 对 象 全 部 无 法 放 入 
Survivor 空 间 (Survivor 空 间 只 有 1MB 大 小 ) ， 所 以 只 好 通过 分 配 担保 
机 制 提前 转移 到 老年 代 去 。 


这 次 GC 结 束 后 ，4MB 的 allocation4 对 和 象 顺 利 分 配 在 Eden 中 ， 因 此 
程序 执行 完 的 结果 是 Eden 占 用 4MB (被 allocation4 占 用 ) ，Survivor 空 
| 内， 老年 代 被 占用 6MB (被 allocation1、allocation2、allocation3 占 
用 ) 。 通 过 GC 日 志 可 以 证 实 这 一 点 。 


注意 ”作者 多 次 提 到 的 Minor GC 和 Full GC 有 什么 不 一 样 吗 ? 


新 生 代 GC (Minor GC) : 指 发 生 在 新 生 代 的 垃圾 收集 动作 ， 因 为 
Java 对 和 象 大 多 都 具备 朝 生 夕 火 的 特性 ， 所 以 Minor GC 非常 频繁 ， 一 般 
回收 速度 也 比较 快 。 


老年 代 GC (Major GC/Full GC) : 指 发 生 在 老年 代 的 GC， 出 现 了 
Major GC， 经 常会 伴随 至 少 一 次 的 Minor GC (但 非 绝 对 的 ， 在 Parallel 
Scavenge 收 集 右 的 收集 策略 里 残 有 直接 进行 Major GC 的 策略 选择 过 
程 ) 。Major GC 的 速度 一 般 会 比 Minor GC 慢 10 倍 以 上 。 


代码 清单 3-5 “新生 代 Minor GC 


private static final int_ 1MB=1024*1024; 

/** 

*VM 参 数 : -verbose:gc-Xms20M-Xmx20M-Xmn10M-XX:+PrintGCDetails 
-XX:SurvivorRatio=8 

*/ 

public static void testAllocation(){ 

byte[]allocationi1, allocation2, allocation3, allocation4; 
allocationi=new byte[2*_1MB]; 

allocation2=new byte[2*_1MB]; 

allocation3=new byte[2*_1MB] ; 

allocation4=new byte[4*_1MB]; // 出 现 一 次 Minor GC 


[GC[DefNew:6651K->148K (9216K) , 0.0070106 secs]6651K->6292K 
(19456K) ， 

0.0070426 Secs][Times:user=0.00 sys=0.00, real=0.00 Secs] 

Heap 

def new generation total 9216K, Used 4326K[Ox029d0000， 
0x033d0000，0x033d0000) 

eden space 8192K, 51%used[0x029d000909, 0x02de4828, 0x031d0000) 

from space 1024K，14%used[9x032d0000，0x032f5370，0Xx033d0000) 

to space 1024K, O%used[0x031d0000, 0x031d0000，0x032d0000) 

tenured generation total 10240K,used 6144K[L0x033d0000， 
Ox03dd0900，0x93dd9000) 

the space 10240K，60%used[0x033d0000，0x039d0030，0x039d0200， 
Ox03dd0000) 

compacting perm gen total 12288K,used 2114K[0Ox03dd0000, 
90x049d0000，0xg07dd0000) 

the Space 12288K, 17%used[Ox03dd0000, 0x03fe0998, 0x03fe0a00, 


Ox049d0000) 
No shared spaces configured. 


[IJIT 即 时 编译 怖 相关 优化 可 参见 第 11 章 。 


3.6.2 ”大 对 象 直接 进入 老年 代 


所 谓 的 大 对 象 是 指 ， 需 要 大 量 连续 内 存 空间 的 Java 对 象 ， 最 典型 
的 大 对 象 就 是 那 种 很 长 的 字符 囊 以 及 数组 〈 笔 者 列 出 的 例子 中 的 byte[] 
数组 就 是 典型 的 大 对 象 ) 。 大 对 象 对 虚拟 机 的 内 存 分 配 来 说 就 是 一 个 
坏 消 恩 ( 玲 Java 虚 拟 机 抱 候 一 句 ， 比 过 到 一 个 大 对 象 更 加 坏 的 消 恩 束 
是 遇 到 一 群 “ 萌 生 夕 炎 ” 的 “短命 大 对 象 ?»， 写 程序 的 时 候 应 当 避 人 免 ) ， 
经 党 出 现 大 对 象 容易 导致 内 存 还 有 不 少 空间 时 束 提 前 触发 垃圾 收集 以 
获取 足够 的 连续 空间 来 “安置 ”它们 。 


虚拟 机 提供 了 一 个 -XX:PretenureSizeThreshold 参 数 ， 令 大 于 这 个 
设置 值 的 对 象 直接 在 老年 代 分 配 。 这 样 做 的 目的 是 避免 在 Eden 区 及 两 
个 Survivor 区 之 间 发 生 大 量 的 内 存 复制 (复习 一 下 新 生 代 采用 复制 算 
法 收集 内 存 ) 。 


执行 代码 清单 3-6 中 的 testPretenureSizeThreshold() 方 法 后 ， 我 们 看 
到 Eden 空 间 几 乎 没有 被 使 用 ， 而 老年 代 的 10MB 空 间 被 使 用 了 40%， 也 
就 是 4MB 的 allocation 对 象 直 接 束 分 配 在 老年 代 中 ， 这 是 因为 
PretenureSizeThreshold 被 设置 为 3MB (就 是 3145728， 这 个 参数 不 能 像 - 
Xmx 之 类 的 参数 一 样 直 接 写 3MB) ， 因 此 超过 3MB 的 对 象 都 会 直接 在 
老年 代 进 行 分 配 。 注 意 ”PretenureSizeThreshold 参 数 只 对 Serial 和 


ParNew 两 款 收 集 器 有 效 ，Parallel Scavenge 收 集 器 不 认识 这 个 参数 ， 
Parallel Scavenge 收 集 器 一 般 并 不 需要 设置 。 如 采 人 过 到 必须 使 用 此 参数 
的 场合 ， 可 以 考虑 ParNew 加 CMS 的 收集 器 组 合 。 


代码 清单 3-6 ”大 对 象 直接 进入 老年 代 


private static final int_ 1MB=1024*1024; 

pA 

*VM 参 数 : -verbose:gc-Xms20M-Xmx20M-Xmn10M-XX:+PrintGCDetails- 
XX:SurvivorRatio=8 

*-XX:PretenureSizeThreshold=3145728 


*/ 
public static void testPretenureSizeThreshold(){ 
byte[]jallLocation; 
allocation=new byte[4*_1MB]; // 直 接 分 配 在 老年 代 中 
} 
运行 结果 
Heap 


def new generation total 9216K,used 671K[0x029d0000，0x033d0000， 
9x033d0000) 

eden space 8192K, 8%used[Qx029d0000, 0x02a77e98, 0x031d0000) 

from space 1024K, QO%used[0x031d000909, 09x931d0000，0x032d009009) 

to space 1024K，06%used[9x032d0000，0x032d0000，0x0933d0000) 

tenured generation total 10240K,used 4096K[0x033d0000， 
Ox03dd0000，0x03dd0000) 

the space 10240K，40%used[0x033d0000，0x037d0010，0x037d0200， 
9x03dd0000) 

compacting perm gen total 12288K,used 2107K[O0x03dd0000， 
0x949d0000，9x07dd0000) 

the Space 12288K, 17%used[Ox03dd0000, Ox03fdefd0, 0x03fdf000, 
Ox049d0000) 

No shared spaces configured. 


3.6.3 ”长 期 存活 的 对 象 将 进入 老年 代 


既然 虚拟 机 采用 了 分 代 收 集 的 思想 来 管理 内 存 ， 那 么 内 存 回收 时 
瓯 必须 能 识别 哪些 对 象 应 放 在 新 生 代 ， 哪 些 对 象 应 放 在 老年 代 中 。 为 
了 做 到 这 点 ， 虚 拟 机 给 每 个 对 象 定义 了 一 个 对 象 年 龄 (Age) 计数 
偶 。 如 果 对 象 在 Eden 出 生 并 经 过 第 一 次 Minor GC 后 仍然 存活 ， 并 且 能 
被 Survivor 容 纳 的 话 ， 将 被 移动 到 Survivor 空 间 中 ， 并 且 对 象 年 龄 设 为 
1。 对 象 在 Survivor 区 中 每 “ 熬 过 ”一 次 Minor GC， 年 龄 就 增加 1 岁 ， 当 它 
的 年 龄 增加 到 一 定 程 度 (默认 为 15 岁 ) ， 就 将 会 被 晋升 到 老年 代 中 。 
对 象 亚 升 老年 代 的 年 龄 国 值 ， 可 以 通过 参数 - 
XX:MaxTenuringThreshold 设 置 。 


读者 可 以 试 试 分 别 以 -XX:MaxTenuringThreshold=1 和 - 
XX:MaxTenuringThreshold=15 两 种 设置 来 执行 代码 清单 3-7 中 的 
testTenuringThreshold() 方 法 ， 此 方法 中 的 allocation1 对 象 需要 256KB 内 
存 ，Survivor 空 间 可 以 容纳 。 当 MaxTenuringThreshold=1 时 ，allocation1 
对 象 在 第 二 次 GC 发 生 时 进入 老年 代 ， 新 生 代 已 使 用 的 内 存 GC 后 非常 
干净 地 变 成 0KB。 而 MaxTenuringThreshold=15 上 时 ， 第 二 次 GC 发 生 后 ， 
allocation1 对 象 则 还 留 在 新 生 代 Survivor 空 间 ， 这 时 新 生 代 仍然 有 
404KB 被 占用 。 


代码 清单 3-7 长 期 存活 的 对 象 进 入 老年 代 


private static final int_ 1MB=1024*1024; 

A 

*VM 参 数 : -verbose:gc-Xms20M-Xmx20M-Xmn10M-XX:+PrintGCDetails- 
XX:SurvivorRatio=8-XX:MaxTenuringThreshold=1 

*-XX:+PrintTenuringDistribution 

4 

@Suppresswarnings ("unused") 

public static void testTenuringThreshold(){ 

byte[]allocation1, allocation2, allocation3; 

allocation1i=new byte[_1MB/4]; 

// 什 么 时 候 进 入 老年 代 取 决 于 XX:MaxTenuringThreshold 设 置 

allocation2=new byte[4*_1MB |]; 

allocation3=new byte[4*_1MB ] ; 

allocation3=null:; 

allocation3=new byte[4*_1MB |]; 

} 


以 MaxTenuringThreshold=1 参 数 来 运行 的 结 


[GC[DefNew 

Desired Survivor size 524288 bytes,new threshold 1 (max 1) 

-age 1:414664 bytes, 414664 total 

:4859K- >404K (9216K) ,0.0065012 secs]4859K- >4500K (19456K) ， 
0.0065283 secs][Times:user=0.02 sys=0.00, real=0.02 Secs] 

[GC[DefNew 

Desired Survivor size 524288 bytes,new threshold 1 (max 1) 

:4500K- >OK (9216K) ,0.0009253 secs]8596K->4500K (19456K) ， 
0.0009458 secs][Times:user=0.00 sys=0.00, real=0.00 Secs] 

Heap 

def new generation total 9216K,used 4178K[0x029d0000, 
Ox033d0000，0Qx033d0000) 

eden space 8192K, 51%used[0x029d0000, 0x02de4828, 0x031d0000) 

from space 1024K, QO%used[Ox031d0000, Ox031d0000，0x032d0000) 

to space 1024K，06%used[9x032d0000，0x032d0000，0x0933d0000) 

tenured generation total 10240K,used 4500K[L0x033d0000， 
9xg93dd0000，0x93dd0000) 

the Space 10240K，43%used[0x033d0000，0x03835348，0x03835400， 
9x03dd0000) 

compacting perm gen total 12288K,used 2114K[O0x03dd0000， 
9x049d0000，0x97dd0000) 


the Space 12288K, 17%used[Ox03dd0000, 0x03fe0998,，0x03fe0a00, 
9x049d0000) 

No Shared spaces configured. 

以 MaxTenuringThreshold=15 参 数 来 运行 的 结果 : 

[GC[DefNew 

Desired Survivor size 524288 bytes,new threshold 15 (max 15) 

-age 1:414664 bytes, 414664 total 

:4859K- >404K (9216K) ,0.0049637 secs]4859K- >4500K (19456K) ， 
0.0049932 Secs][Times:user=0.00 sys=0.00, real=0.00 Secs] 

[GC[DefNew 

Desired Survivor size 524288 bytes,new threshold 15 (max 15) 

-age 2:414520 bytes, 414520 total 

:4500K- >404K (9216K) ,0.0008091 secs]8596K- >4500K (19456K) ， 
0.0008305 secs][Times:user=0.00 sys=0.00, real=0.00 Secs] 

Heap 

def new generation total 9216K,used 4582K[0x029d0000, 
90x033d0000，0x033d0000) 

eden space 8192K, 51%used[0x029d0000, 0x02de4828, 0x031d0000) 

from space 1024K，39%used[90x031d0000，0x03235338，0Xx032d0000) 

to space 1024K，06%used[9x032d0000，90x032d0000，0x033d0000) 

tenured generation total 10240K,used 4096K[0x033d0000， 
Ox03dd0000，0x03dd00090) 

the space 10240K，40%used[0x033d0000，0x037d0010，0x037d0200， 
9x03dd0000) 

compacting perm gen total 12288K, Used 2114K[O0x03dd0000， 
9x049d0000，0x97dd0000) 

the Space 12288K, 17%used[Ox03dd0000, 0x03fe0998, 0x03fe0a00, 
9x049d0000) 

No Shared spaces configured. 


3.6.4 ”动态 对 象 年 龄 判定 


为 了 能 更 好 地 适应 不 同 程序 的 内 存 状 况 ， 虚 拟 机 并 不 是 永远 地 要 
求 对 象 的 年 龄 必须 达到 了 MaxTenuringThreshold 才 能 晋升 老年 代 ， 如 果 
在 Survivor 空 间 中 相同 年 龄 所 有 对 象 大 小 的 总 和 大 于 Survivor 空 间 的 一 
半 ， 年 龄 大 于 或 等 于 该 年 龄 的 对 象 就 可 以 直接 进入 老年 代 ， 无 须 等 到 
MaxTenuringThreshold 中 要 求 的 年 龄 。 


执行 代码 清单 3-8 中 的 testTenuringThreshold20) 方 法 ， 并 设置 - 
XX:MaxTenuringThreshold=15， 会 发 现 运行 结果 中 Survivor 的 空间 占用 
仍然 为 0%， 而 老年 代 比 预期 增加 了 6%， 也 就 是 说 ，allocation1 、 
allocation2 对 象 都 直接 进入 了 老年 代 ， 而 没有 等 到 15 罗 的 临界 年 龄 。 
为 这 两 个 对 象 加 起 来 已 经 到 达 了 512KB， 并 且 它 们 是 同年 的 ， 满 足 同 
年 对 象 达到 Survivor 空 间 的 一 半 规 则 。 我 们 只 要 注释 掉 其 中 一 个 对 象 
new 操 作 ， 就 会 发 现 另 外 一 个 就 不 会 普 升 到 老年 代 中 去 了 。 


代码 清单 3-8 动态 对 象 年 龄 判定 


private static final Int_1MB=1024*1024; 

A** 

*VM 人 参数 : -verbose:gc-Xms20M-Xmx20M-Xmn10M-XX:+PrintGCDetails- 
XX:SurvivorRatio=8-XX:MaxTenuringThreshold=15 

*-XX:+PrintTenuringDistribution 

*/ 

@Ssuppresswarnings ("unused") 

public static void testTenuringThreshold2()t{ 

byte[]allocation1, allocation2, allocation3, allocation4; 


allocationi=new byte[_1MB/4]:; 
//allocation1+allocation2 大 于 survivo 空 间 一 
allocation2=new byte[_1MB/4]; 
allocation3=new byte[4*_1MB]; 
allocation4=new byte[4*_1MB] ; 
allocation4=null; 

allocation4=new byte[4*_1MB |]; 


} 


I 


运行 结果 : 


[GC[DefNew 

Desired Survivor size 524288 bytes,new threshold 1 (max 15) 

-age 1:676824 bytes, 676824 total 

:5115K- >660K (9216K) ,， 0.0050136 secs]5115K->4756K (19456K) ， 
0.0050443 Secs][Times:user=0.00 sys=0.01, real=0.01 secs] 

[GC[DefNew 

Desired Survivor size 524288 bytes,new threshold 15 (max 15) 

:4756K- >QK (9216K) ,0.0010571 secs]8852K->4756K (19456K) ， 
0.0011009 secs][Times:user=0.00 sys=0.00, real=0.00 Secs] 

Heap 

def new generation total 9216K,used 4178K[0x029d0000, 
0x033d0000，0x033d0000) 

eden space 8192K，51%used[9x029d0000，0x02de4828，0x031d0000) 

from space 1024K, QO%used[Ox031d0000, 0x031d0000，0x032d0900) 

to space 1024K, QO%used[0x032d0000,，0x032d0000，0x033d0000) 

tenured generation total 10240K,used 4756K[L0x033d0000， 
9xg93dd0000，0x93dd0000) 

the space 10240K，46%used[0x033d0000，0x038753e8，0x03875400， 
9x03dd0000) 

compacting perm gen total 12288K, Used 2114K[O0x03dd0000， 
9x049d0000，0x97dd0000) 

the Space 12288K，17%used[0x03dd0000，0x03fe09a0，0Xx03fe0a00， 
9x049d0000) 

No Shared spaces configured. 


3.6.5 ”空间 分 配 担 保 


在 发 生 Minor GC 之 前 ， 虚 拟 机 会 先 检 查 老 年 代 最 大 可 用 的 连续 空 
间 是 否 大 于 新 生 代 所 有 对 象 总 空间 ， 如 果 这 个 条 件 成 立 ， 那 么 Minor 
GC 可 以 确保 是 安全 的 。 如 果 不 成 立 ， 则 虚拟 机 会 查看 
HandlePromotionFailure 设 置 值 是 否 允 许 担保 失败 。 如 有 果 人 允许 ， 那 么 会 
继续 检查 老年 代 最 大 可 用 的 连续 空间 是 否 大 于 历次 晋升 到 老年 代 对 象 
的 平均 大 小 ， 如 果 大 于 ， 将 尝试 着 进行 一 次 Minor GC， 尽 管 这 次 
Minor GC 是 有 风险 的 ， 如 果 小 于 ， 或 者 HandlePromotionFailure 设 置 不 
允许 冒险 ， 那 这 时 也 要 改 为 进行 一 次 Full GC。 


下 面 解释 一 下 冒险 "是 冒 了 什么 风险 ， 前 面 提 到 过 ， 痢 生 代 使 用 
复制 收集 算法 ， 但 为 了 内 存 利 用 率 ， 只 使 用 其 中 一 个 Survivor 空 间 来 作 
为 轮换 备份 ， 因 此 当 出 现 大 量 对 象 在 Minor GC 后 仍然 存活 的 情况 (最 
极端 的 情况 就 是 内 存 回 收 后 新 生 代 中 所 有 对 象 都 存活 ) ， 束 需要 老年 
代 进 行 分 配 担 保 ， 把 Survivor 无 法 容纳 的 对 象 直接 进入 老年 代 。 与 生活 
中 的 贷款 担保 类 似 ， 老 年 代 要 进行 这 样 的 担 傈 ， 前 提 是 老年 代 本 身 还 
有 容纳 这 些 对 象 的 剩余 空间 ， 一 共有 多 少 对 象 会 活 下 来 在 实际 完成 内 
存 回 收 之 前 是 无 法 明确 知道 的 ， 所 以 只 好 取 之 前 每 一 次 回收 晋升 到 老 
年 代 对 象 容量 的 平均 大 小 值 作 为 经 验 值 ， 与 老年 代 的 剩余 空间 进行 比 
较 ， 决 定 是 否 进 行 Full GC 来 让 老年 代 腾 出 更 多 空间 。 


取 和 平均 值 进行 比较 其 实 仍然 是 一 种 动态 概率 的 手段 ， 也 就 是 说 ， 
如 果 某 次 Minor GC 存 活 后 的 对 象 突 增 ， 远 远 高 于 平均 值 的 话 ， 依 然 会 
导致 担保 失败 (Handle Promotion Failure) 。 如 果 出 现 了 
HandlePromotionFailure 失 败 ， 那 就 只 好 在 失败 后 重 狐 发 起 一 次 Full 
GC。 虽 然 担保 失败 时 绕 的 圈子 是 最 大 的 ， 但 大 部 分 情况 下 都 还 是 会 将 
HandlePromotionFailure 开 关 打 开 ， 避 免 Full GC 过 于 频繁 ， 参 见 代 码 清 


单 3-9， 请 读者 在 JDK 6 Update 24 之 前 的 版 本 中 运行 测试 。 
代码 清单 3-9 ”空间 分 配 担 保 


private static final int_ 1MB=1024*1024; 

ss 

*VM 参 数 : -Xms20M-Xmx20M-Xmn10M-XX:+PrintGCDetails- 
XX:SurvivorRatio=8-XX:-HandlePromotionFailure 

*/ 

@Suppresswarnings ("unused") 

public static void testHandlePromotion(){ 

byte[]allocation1, allocation2, allocation3, allocation4, 
allocation5, allocation6, allocation7; 

allocationi=new byte[2*_1MB]; 

allocation2=new byte[2*_1MB]; 

allocation3=new byte[2*_1MB]; 

allocation1i=null:; 

allocation4=new byte[2*_1MB] ; 

allocation5=new byte[2*_1MB] ; 

allocation6=new byte[2*_1MB] ; 

allocation4=null; 

allocation5=null; 

allocation6=null:; 

allocation7=new byte[2*_1MB]; 

} 


以 HandlePromotionFailure=false 参 数 来 运行 的 结果 : 


[GC[DefNew:6651K- >148K (9216K) , 0.0078936 secs]6651K- >4244K 
(19456K) ，0.0079192 secs][Times:user=0.00 sys=0.02, real=0.02 secs] 

[GC[DefNew:6378K->6378K (9216K) ，0.0000206secs][Tenured:4096K- > 
4244K (10240K) , 0.0042901 secs]10474K->4244K (19456K) ，[Perm:2104K- 
>2104K (12288K) ], 0.0043613 secs][Times:user=0.00 sys=0.00, 
real=0.00 secs] 


以 HandlePromotionFailure=true 参 数 来 运行 的 结果 : 


[GC[DefNew:6651K- >148K (9216K) , 0.0054913 secs]6651K->4244K 
(19456K) , 0.0055327 secs][Times:user=0.00 sys=0.00, real=0.00 secs] 
[GC[DefNew:6378K- >148K (9216K) , 0.0006584 secs]10474K->4244K 
(19456K) , 0.0006857 secs][Times:user=0.00 sys=0.00, real=0.00 secs] 


在 JDK 6 Update 24 之 后 ， 这 个 测试 结果 会 有 差异 ， 
HandlePromotionFailure 参 数 不 会 再 影响 到 虚拟 机 的 空间 分 配 担保 策 
略 ， 观 察 OpenJDK 中 的 源码 变化 〈 见 代码 清单 3-10) ， 虽 然 源码 中 还 
定义 了 HandlePromotionFailure 参 数 ， 但 是 在 代码 中 已 经 不 会 再 使 用 
它 。JDK 6 Update 24 之 后 的 规则 变 为 只 要 老年 代 的 连续 空间 大 于 新 生 
代 对 象 总 大 小 或 者 历次 晋升 的 平均 大 小 就 会 进行 Minor GC， 否 则 将 进 
行 Full GC。 


代码 清单 3-10 HotSpot 中 空间 分 配 检 查 的 代码 片段 


bool TenuredGeneration:promotion_attempt_is_safe (size t 
max_promotion_ in_bytes) const{ 
// 老 年 代 最 大 可 用 的 连续 空间 
size_t available=max_contiguous_available( ); 
// 每 次 晋升 到 老年 代 的 平均 大 小 
size _t av_promo= (Size_t) gc_stats()->avg promoted()-> 
padded_average( ); 
// 老 年 代 可 用 空间 是 否 大 于 平均 晋升 大 小 ， 或 者 老年 代 可 用 空间 是 否 大 于 当 此 GC 时 新 4 
代 所 有 对 象 容量 


| 


bool res= (available>=av_promo) || (available>= 
max_promotion_ in_bytes) ; 
return res; 


} 


3.7 ”本章 小 结 


本 章 介绍 了 垃圾 收集 的 算法 、 儿 款 JDK 1.7 中 提供 的 垃圾 收集 紫 特 
点 以 及 运作 原理 。 通 过 代码 实例 验证 了 Java 虚 拟 机 中 目 动 内 存 分 配 及 
回收 的 主要 规则 。 


内 存 回收 与 垃圾 收集 器 在 很 多 时 候 都 是 影响 系统 性 能 、 并 发 能 

的 主要 因素 之 一 ， 虚 拟 机 之 所 以 提供 多 种 不 同 的 收集 右 以 及 提供 大 量 
的 调 世 参数， 是 因为 只 有 根据 实际 应 用 需求 、 实 现 方式 选择 最 优 的 收 
集 方式 才能 获取 最 噩 的 性 能 。 没 有 固定 收集 器 、 参 数组 合 ， 也 没有 最 
优 的 调 优 方法 ， 虚 拟 机 也 束 没 有 什么 必然 的 内 存 回 收 行为 。 因 此 ， 学 
习 虚 拟 机 内 存 知识 ， 如 条 要 到 实践 调 优 阶段 ， 那 么 必须 了 解 每 个 具体 
收集 右 的 行为 、 优 势 和 劣势 、 调 市 参数 。 在 接 下 来 的 两 草 中 ， 作 者 将 
会 介绍 内 存 分 析 的 工具 和 调 优 的 一 些 具 体 案 例 。 


第 4 章 ”虚拟 机 性 能 监控 与 故障 处 理工 具 


Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 
的 “高 墙 "， 墙 外 面 的 人 想 进 去 ， 墙 里 面 的 人 却 想 出 来 。 


4.1 概述 


过 前 面 两 章 对 于 虚拟 机 内 存 分 配 与 回收 技术 各 方面 的 介绍 ， 相 
信 读 者 已 经 建立 了 一 套 比较 完整 的 理论 基础 。 理 论 总 是 作为 指导 实践 
的 工具 ， 能 把 这 些 知 识 应 用 到 实际 工作 中 才 是 我 们 的 最 终 目 的 。 接 下 
来 的 两 章 ， 我 们 将 从 实践 的 角度 去 了 解 虚拟 机 内 存 管 理 的 世界 。 


给 一 个 系统 定位 问题 的 时 候 ， 知 识 、 经 验 是 关键 基础 ， 数 据 是 依 
据 ， 工 具 是 运用 知识 处 理 数据 的 手段 。 这 里 说 的 数据 包括 : 运行 日 
志 、 异 常 堆栈 、GC 日 志 、 线 程 快照 (threaddumpyjavacore 文 件 ) 、 堆 
转 储 快照 (heapdump/hprof 文 件 ) 等 。 经 常 使 用 适当 的 虚拟 机 监控 和 
分 析 的 工具 可 以 加 快 我 们 分 析 数 据 、 定 位 解决 问题 的 速度 ， 但 在 学 习 
工具 前 ， 也 应 当 意 识 到 工具 永远 都 是 知识 技能 的 一 层 包装 ， 没 有 什么 
工具 是 “秘密 武器 ”， 不 可 能 学 会 了 惑 能 包 治 百 病 。 


4.2 ” JDK 的 命令 行 工 具 


Java 开 发 人 员 肯 定 都 知道 JDK 的 bin 目 录 中 
有 "java.exe"、"javac.exe" 这 两 个 命令 行 工具 ， 但 并 非 所 有 程序 员 都 了 解 
过 JDK 的 bin 目 录 之 中 其 他 命令 行程 序 的 作用 。 每 逢 JDK 更 新 版 本 之 
时 ，bin 目 录 下 命令 行 工具 的 数量 和 功能 总 会 不 知 不 觉 地 增加 和 增强 。 
bin 目 隶 的 内 容 如 图 4-1 所 示 。 


在 本 章 中 ， 笔 者 将 介绍 这 些 工具 的 其 中 一 部 分 ， 主 要 包括 用 于 监 
钢 虚 拟 机 和 故障 处 理 的 工具 。 这 些 故 障 处 理工 具 被 Sun 公 司 作 为 “ 礼 
物 ” 附 赠 给 JDK 的 使 用 者 ， 并 在 软件 的 使 用 说 明 中 把 它们 声明 为 “没有 技 
术 支 持 并 有 旦 是 实验 性 质 的 ”(unsupported and experimental) 中 的 产品 ， 
但 事实 上 ， 这 些 工具 都 非常 稳定 而 且 功能 强大 ， 能 在 处 理应 用 程序 性 
能 问题 、 定 位 故障 时 发 挥 很 大 的 作用 。 


名 称 壬 改 日 期 


[xjc.exe 2010/7/19 11:56 
四 3] wsimport.exe 2010/7/19 11:56 
| Wsgen,exe 2010/7/19 11:56 
unpack200.exe 010/7/19 11:56 
0/7/19 11:56 
0/7/19 11:56 
0/7/19 11:56 
0f7/19 11:56 
rmiregistry.exe 2010/7/19 11:56 
rmid.exe 2010/7/19 11:56 

rmic.exe 2010/7/19 11:56 
a policytool,exe 2010/7/19 11:56 
[名 packager.exe 2010/7/19 11:56 
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图 4-1 SunJDK 中 的 工具 目录 


说 起 JDK 的 工具 ， 比 较 细心 的 读者 ， 可 能 会 注意 到 这 些 工具 的 程序 
体积 都 异常 小 巧 。 假 如 以 前 没 注意 到 ， 现 在 不 妨 再 看 看 图 4-1 中 的 最 后 
一 列 “ 大 小 ”"， 几 乎 所 有 工具 的 体积 基本 上 部 稳定 在 27KB 左 右 。 并 非 
JDK 开 发 团队 刻意 把 它们 制作 得 如 此 精炼 来 炫 站 编程 水 平 ， 而 是 因为 这 
些 命令 行 工具 大 多 数 是 jdwlib/tools.jar 类 库 的 一 层 薄 包装 而 已 ， 它 们 主 
要 的 功能 代码 是 在 tools 类 库 中 实现 的 。 读 者 把 图 4-1 和 图 4-2 两 张 图 片 对 
比 一 下 束 可 以 看 得 很 清楚 。 


假如 读者 使 用 的 是 Linux 版 本 的 JDK， 还 会 发 现 这 些 工 具 中 很 多 其 
至 就 是 由 Shell 脚 本 直接 写成 的 ， 可 以 用 vim 直 接 打开 它们 。 


JDK 开 发 团队 选择 采用 Java 代 码 来 实现 这 些 监控 工具 是 有 特别 用 和 意 
的 : 当 应 用 程序 部 署 到 生产 环境 后 ， 无 论 是 直接 接触 物理 服务 器 还 是 
远程 Telnet 到 服务 右上 都 可 能 会 受到 限制 。 借 助 tools.jar 类 库 里 面 的 接 
口 ， 我 们 可 以 直接 在 应 用 程序 中 实现 功能 强大 的 监控 分 析 功 能 局 。 


泗 tools. jar\sun\tools - ZIF 压缩 交 件 ， 解 包 大 小 为 11, 923, 2 


Fol der 201079715 

Folder 2010/9/15 

Folder 2010/9/15 

Folder 201079715 

Folder ”201079715 

Folder 2010/9/15 

Folder 2010/9/15 

Folder 201079715 

Fol der 2010797/15 

Folder ”201079715 
,jstack Folder 201079715 

| jstat Folder 2010/9/15 

jstatd Folder 2010/9715 
native2ascil Folder 2010/9/15 
) serialver Folder 2010/9/15 

| tree Folder 201079715 

J util Folder 201079715 


图 4-2 tools.jar 包 的 内 部 状况 


需要 特别 说 明 的 是 ， 本 章 介 绍 的 工具 全 部 基于 Windows 平 台 下 的 
JDK 1.6 Update 21， 如 果 JDK 版 本 、 操 作 系 统 不 同 ， 工 具 所 支持 的 功能 
可 能 会 有 较 大 差别 。 大 部 分 工具 在 JDK 1.5 中 就 已 经 提供 ， 但 为 了 避免 
运行 环境 带 来 的 差异 和 兼容 性 问题 ， 建 议 读者 使 用 JDK 1.6 来 验证 本 章 
介绍 的 内 容 ， 因 为 JDK 1.6 的 工具 可 以 正当 兼容 运行 于 JDK 1.5 的 虚拟 机 
之 上 的 程序 ， 反 之 则 不 一 定 。 表 4-1 中 说 明了 JDK 主 要 命令 行 监控 工具 
的 用 途 。 


注意 ”如 果 读 者 在 工作 中 需要 监控 运行 于 JDK 1.5 的 虚拟 机 之 上 的 
程序 ， 在 程序 启动 时 请 添加 参数 "-Dcom.sun.management.jmxremote" 开 
启 JMX 管 理 功能 ， 否 则 由 于 部 分 工具 都 是 基于 JMX (包括 4.3 节 介绍 的 
可 视 化 工具 ) ， 它 们 都 将 会 无 法 使 用 ， 如 果 被 监控 程序 运行 于 JDK 1.6 
的 虚拟 机 之 上 ， 那 JMX 管 理 默认 是 开启 的 ， 虚 拟 机 启动 时 无 须 再 添加 
任何 参数 。 


表 4-1 Sun JDK 监控 和 故障 处 理工 具 


名 称 主要 作用 
jps | JVM Process Status Tool， 显 示 指 定 系 统 内 所 有 的 HotSpot 虚拟 机 进程 
jstat | JVM Statistics Monitoring Tool， 用 于 收集 HotSpot 虚拟 机 各 方面 的 运行 数据 


jinfo | Configuration Info for Java， 显 示 虚 拟 机 配置 信息 


名 称 主要 作用 
jmap Memory Map for Java， 生 成 虚拟 机 的 内 存 转 储 快 照 (heapdump 文件 ) 
二 JVM Heap Dump Browser， 用 于 分 析 heapdump 文件 ， 它 会 建立 一 个 HTTP/HTML 服 
务 器 ， 让 用 户 可 以 在 浏览 器 上 查看 分 析 结 果 
jstack Stack Trace for Java， 显 示 虚 拟 机 的 线程 快照 


4.2.1 jps: 虚拟 机 进程 状况 工具 


JDK 的 很 多 小 工具 的 名 字 都 参考 J UNIX 命令 的 命名 方式 ，jps 
(JVM Process Status Tool) 是 其 中 的 典型 。 除 了 名 字 像 UNIX 的 ps 命令 
之 外 ， 它 的 功能 也 和 ps 命令 类 似 ， 可 以 列 出 正在 运行 的 虚拟 机 进程 ， 
并 显示 虚拟 机 执行 主 类 (Main Class,main0) 函 数 所 在 的 类 ) 名 称 以 及 这 
些 进程 的 本 地 虚拟 机 唯一 ID (Local Virtual Machine 
Identifier,LVMID) 。 虽 然 功 能 比较 单一 ， 但 它 是 使 用 频率 最 高 的 JDK 
命令 行 工具 ， 因 为 其 他 的 JDK 工 具 大 多 需要 输入 它 查 询 到 的 LVMID 来 
确定 要 监控 的 是 哪 一 个 虚拟 机 进程 。 对 于 本 地 虚拟 机 进程 来 说 ， 
LVMID 与 操作 系统 的 进程 ID (Process Identifier,PID) 是 一 致 的 ， 使 用 
Windows 的 任务 管理 器 或 者 UNIX 的 ps 命令 也 可 以 查询 到 虚拟 机 进程 的 
LVMID， 但 如 果 同 时 局 动 了 多 个 虚拟 机 进程 ， 无 法 根据 进程 名 称 定位 
时 ， 那 就 只 能 依赖 jps 命 令 显示 主 类 的 功能 才能 区 分 了 。 


jps 命 令 格 式 : 


jps[options][hostid] 


jps 执 行 样 例 : 


D:\Develop\Java\jdk1.6.0 21\bin>jps-1 

2388 D:\Develop\glassfish\bin\..\modules\admin-cli.jar 
2764 com.sun.enterprise.glassfish.bootstrap.ASMain 
3788 sun.tools.jps.Jps 


jps 可 以 通过 RMI 协 议 查 询 开 局 了 RMI 服 务 的 远程 虚拟 机 进程 状 
候 ，hostid 为 RMI 注 册 表 中 注册 的 主机 名 。jps 的 其 他 第 用 选项 见 表 4-2。 


表 4-2 jps 工具 主要 选项 
选 项 作 用 
-q | 只 输出 LVMID， 省 略 主 类 的 名 称 
-m | 输出 虚拟 机 进程 启动 时 传递 给 主 类 main() 函数 的 参数 
-1 | 输出 主 类 的 全 名 ， 如 果 进 程 执 行 的 是 Jar 包 ， 输 出 Jar 路 径 
输出 虚拟 机 进程 启动 时 JVM 参 妆 


ji 


[1]http://download.oracle.com/javase/6/docs/technotes/tools/index.html ° 
[2]tools.jar 中 的 类 库 不 属于 Java 的 标准 API， 如 果 引 入 这 个 类 库 ， 就 意味 
着 用 户 的 程序 只 能 运行 于 Sun Hotspot (或 一 些 从 Sun 公 司 购买 了 JDK 的 
源码 License 的 虚拟 机 ， 如 IBM J9、BEA JRockit) 上 面 ， 或 者 在 部 署 程 
序 时 需要 一 起 部 署 tools.jar。 


4.2.2 jstat: 虚拟 机 统计 信息 监视 工具 


一 一 


jstat (JVM Statistics Monitoring Tool) 是 用 于 监视 虚拟 机 各 种 运行 
状态 信息 的 命令 行 工 具 。 它 可 以 显示 本 地 或 者 远程 趾 虚 拟 机 进程 中 的 类 
装载 、 内 存 、 垃 圾 收集 、JIT 编 译 等 运行 数据 ， 在 没有 GUI 图 形 界 面 ， 
只 提供 了 纯 文本 控制 台 环 境 的 服务 器 上 ， 它 将 是 运行 期 定位 虚拟 机 性 
能 问题 的 首选 工具 。 


jstat 命 令 格式 为 : 
jstat[option vmid[interval[s|lms][count]]] 


对 于 命令 格式 中 的 VMID 与 LVMID 需 要 特别 说 明 一 下 : 如 果 是 本 地 
虚拟 机 进程 ，VMID 与 LVMID 是 一 致 的 ， 如 果 是 远程 虚拟 机 进程 ， 那 
VMID 的 格式 应 当 是 : 


[protocol:][//]lvmid[@hostname[:port]/servername] 


参数 interval 和 count 代 表 查 询 间 隅 和 次 数 ， 如 果 省 略 这 两 个 参数 ， 
说 明 只 查询 一 次 。 假 设 需要 每 250 毫 秒 查询 一 次 进程 2764 垃 圾 收集 状 


况 ， 一 共 碍 询 20 次 ， 那 命令 应 当 坪 : 


jstat-gc 2764 250 20 


选项 option 代 表 着 用 户 和 希望 查询 的 虚拟 机 信息 ， 主 要 分 为 3 类 : 类 
淡 载 、 垃 圾 收集 、 运 行 期 编译 状况 ， 具 体 选 项 及 作用 请 参考 表 4-3 中 的 


描述 。 


表 4-3 jstat 工具 主要 选项 


选 项 作 用 

-class 监视 类 装载 、 印 载 数 量 、 总 空间 以 及 类 装载 所 耗费 的 时 间 
监视 Java 堆 状 况 ， 包 括 Eden 区 、 两 个 survivor 区 、 老 年 代 、 永 久 代 等 的 容量 、 已 用 空 

Es 间 、GC 时 间 合计 等 信息 
-gccapacity 监视 内 容 与 -gc 基本 相同 ， 但 输出 主要 关注 Java 堆 各 个 区 域 使 用 到 的 最 大 、 最 小 空间 
-gcutil 监视 内 容 与 -gc 基本 相同 ， 但 输出 主要 关注 已 使 用 空间 占 总 空间 的 百分比 
-gccause 与 -gcutil 功能 一 样 ， 但 是 会 额外 输出 导致 上 一 次 GC 产生 的 原因 
-gcnew 监视 新 生 代 GC 状况 
-gcnewcapacity 监视 内 容 与 - gcnew 基本 相同 ， 输 出 主要 关注 使 用 到 的 最 大 、 最 小 空间 
-gcold 监视 老年 代 GC 状况 
-gcoldcapacity 监视 内 容 与 - gcold 基本 相同 ， 输 出 主要 关注 使 用 到 的 最 大 、 最 小 空间 
-gcpermcapacity 输出 永久 代 使 用 到 的 最 大 、 最 小 空间 
-compiler 输出 JIT 编译 带 编 译 过 的 方法 、 耗 时 等 信息 
-printcompilation 输出 已 经 被 JIT 编译 的 方法 


jstat 监 视 选项 众多 ， 周 于 版 面 原因 无 法 逐一 演示 ， 这 里 仪 举 监视 一 
台 刚 刚 局 动 的 GlassFish v3 服务 器 的 内 存 状 况 的 例子 来 演示 如 何 查 看 监 
视 结果 。 监 视 参 数 与 输出 结果 如 代码 清单 4-1 所 示 。 


代码 清单 4-1 jstat 执 行 样 例 


D:\Develop\Java\jdk1.6.0 21\bin>jstat-gcutil 2764 
SO Si1E DO P YGC YGCT FGC FGCT GCT 
0.00 0.00 6.20 41.42 47.20 16 0.105 3 0.472 0.577 


查询 结果 表明 : 这 台 服 务 器 的 新 生 代 Eden 区 (E， 表 示 Eden) 使 用 
了 6.2% 的 空间 ， 两 个 Survivor 区 〈S0、S1， 表 示 Survivor0、Survivorl ) 


里 面 都 是 空 的 ， 老 年 代 (O， 表 示 Old) 和 永久 代 (P， 表 示 

Permanent) 则 分 别 使 用 了 41.42% 和 47.20% 的 空间 。 程 序 运行 以 来 共 发 
生 Minor GC (YGC， 表 示 Young GC) 16 次 ， 总 耗 时 0.105 秒 ， 发 生 Full 
GC (FGC， 表 示 Full GC) 3 次 ，Full GC 总 耗 时 (FGCT， 表 示 Full GC 


Time) 为 0.472 秒 ， 所 有 GC 总 耗 时 (GCT， 表 示 GC Time) 为 0.577 秒 。 


使 用 jstat 工 具 在 纯 文 本 状态 下 监视 虚拟 机 状态 的 变化 ， 确 实 不 如 后 
面 将 会 提 到 的 VisualVM 等 可 视 化 的 监视 工具 直接 以 图 表 展 现 那 样 直 
观 。 但 许多 服务 右 管 理 员 痢 习惯 了 在 文本 控制 台中 工作 ， 直 接 在 控制 
台中 使 用 jstat 命 令 依 然 古 一 种 第 用 的 监控 方式 。 


[1] 需 要 远程 主机 提供 RMI 支 持 ，Sun 提 供 的 jstatd 工 具 可 以 很 方便 地 建立 
远程 RMI 服 务 器 。 


4.2.3 ”jinfo: Java 配 置信 息 工 具 


jinfo (Configuration Info for Java) 的 作用 是 实时 地 查看 和 调整 虚 
拟 机 各 项 参数 。 使 用 jps 命 令 的 -v 参 数 可 以 查看 虚拟 机 启动 时 显 式 指定 
的 参数 列表 ， 但 如 果 想 知道 未 被 显 式 指 定 的 参数 的 系统 默认 值 ， 除 了 
去 找 资料 外 ， 就 只 能 使 用 jinfo 的 -flag 选 项 进行 查询 了 (如 果 只 限于 
JDK 1.6 或 以 上 版 本 的 话 ， 使 用 java-XX:+PrintFlagsFinal 查 看 参数 默认 
值 也 是 一 个 很 好 的 选择 ) ，jinfo 还 可 以 使 用 -sysprops 选 项 把 虚拟 机 进 
程 的 System.getPropertiesO 的 内 容 打印 出 来 。 这 个 命令 在 JDK 1.5 时 期 已 
经 随 着 Linux 版 的 JDK 发 布 ， 当 时 只 提供 了 信息 查询 的 功能 ，JDK 1.6 
之 后 ，jinfo 在 Windows 和 Linux 平 台 都 有 提供 ， 并 且 加 入 了 运行 期 修改 
参数 的 能 力 ， 可 以 使 用 -flag[+|-jname 或 者 -flag name=value 修 改 一 部 分 
运行 期 可 写 的 虚拟 机 参数 值 。JDK 1.6 中 ，jinfo 对 于 Windows 平 台 功 能 
仍然 有 较 大 限制 ， 只 提供 了 最 基本 的 -flag 选 项 。 


jinfo 命 令 格式 : 
jinfo[option]pid 
执行 样 例 : 查询 CMSInitiatingOccupancyFraction 参 数值 。 


C:\>jinfo-flag CMSInitiatingOccupancyFraction 1444 
-XX:CMSINitiatingOccupancyFraction=85 


4.2.4 ”jmap: Java 内 存 映 像 工具 


jmap (Memory Map for Java) 命令 用 于 生成 堆 转 储 快照 (一 般 称 
为 heapdump 或 dump 文 件 ) 。 如 果 不 使 用 jmap 命 令 ， 要 想 获 取 Java 堆 转 
储 快照 ， 还 有 一 些 比较 “暴力 ”的 手段 ， 壁 如 在 第 2 章 中 用 过 的 - 
XX:+HeapDumpOnOutOfMemoryError 参 数 ， 可 以 让 虚拟 机 在 OOM 异 常 
出 现 之 后 自动 生成 dump 文 件 ， 通 过 -XX:+HeapDumpOnCtrlBreak 参 数 则 
可 以 使 用 [Ctr]+[Break] 键 让 虚拟 机 生成 dump 文 件 ， 又 或 者 在 Linux 系 统 
下 通过 Kil-3 命 令 发 送 进程 退出 信号 “ 吓 踢 ”一 下 虚拟 机 ， 也 能 拿 到 dump 
Ty 


jmap 的 作用 并 不 仅仅 是 为 了 获取 dump 文 件 ， 它 还 可 以 查询 finalize 
执行 队列 、Java 堆 和 永久 代 的 详细 信息 ， 如 空间 使 用 率 、 当 前 用 的 是 哪 
种 收集 器 等 。 


和 jinfo 命 令 一 样 ，jmap 有 不 少 功能 在 Windows 平 台 下 都 是 受 限 的 ， 
除了 生成 dump 文 件 的 -dump 选 项 和 用 于 查看 每 个 类 的 实例 、 空 间 占 用 
统计 的 -histo 选 项 在 所 有 操作 系统 都 提供 之 外 ， 其 余 选 项 都 只 能 在 
Linux/Solaris 下 使 用 。 


jmap 命 令 格式 : 


jmap[option]vmid 


option 选 项 的 合法 值 与 具体 合 义 见 表 4-4。 


选 项 


-dump 


-finalizerinfo 


-heap 


-histo 


表 4-4 jmap 工具 主要 选项 


作 用 

生成 Java 堆 转 储 快照 。 格 式 为 : -dump:[live，]format=b，file=<filename>， 
其 中 live 子 参数 说 明 是 和 否 只 dump 出 存活 的 对 象 

显示 在 F-Queue 中 等 待 Finalizer 线程 执行 fnalize 方法 的 对 象 。 只 
在 Linux / Solaris 平台 下 有 效 

显示 Java 堆 详 细 信 息 ， 如 使 用 哪 种 回收 器 、 参 数 配 置 、 分 代 状 况 
等 。 只 在 Linux / Solaris 平台 下 有 效 

显示 堆 中 对 象 统计 信息 ， 包 括 类 、 实 例 数量 、 合 计 容 量 


-permstat 


以 ClassLoader 为 统计 口径 显示 永久 代 内 存 状 态 。 


只 在 Linux / 
Solaris 平台 下 有 效 


-上 


当 虚 拟 机 进程 对 -dump 选项 没有 响应 时 ， 


可 使 用 这 个 选项 强制 生成 
dump 快照 。 只 在 Linux / Solaris 平台 下 有 效 


代码 清单 4-2 是 使 用 jmap 生 成 一 个 正在 运行 的 Eclipse 的 dump 快 照 文 
件 的 例子 ， 例 子 中 的 3500 是 通过 jps 命 令 查 询 到 的 LVMID 。 


代码 清单 4-2 ”使 用 jmap 生 成 duamp 文 件 


C:\Users\IcyFenix>jmap-dump:format=b, file=eclipse.bin 3500 


Dumping heap to C:\Users\IcyFenix\eclipse.bin 
Heap dump file created 


4.2.5 jhat: 虚拟 机 堆 转 储 快 照 分 析 工 具 


Sun JDK 提 供 jhat (JVM Heap Analysis Tool) 命令 与 jmap 搭 配 使 
用 ， 来 分 析 jmap 生 成 的 堆 转 储 快照 。jhat 内 置 了 一 个 微型 的 
HTTP/HTML 服 务 器 ， 生 成 dqmp 文 件 的 分 析 结 果 后 ， 可 以 在 浏览 絮 中 
查看 。 不 过 实事 求 是 地 说 ， 在 实际 工作 中 ， 除 非 笔 者 手 上 真 的 没有 别 
的 工具 可 用 ， 否 则 一 般 都 不 会 去 直接 使 用 jhat 命 令 来 分 析 dump 文 件 ， 主 
要 原因 有 二 : 一 是 一 般 不 会 在 部 署 应 用 程序 的 服务 右上 直接 分 析 dump 
文件 ， 即 使 可 以 这 样 做 ， 也 会 尽量 将 dump 文 件 复制 到 其 他 机 器 号 上 进 
行 分 析 ， 因 为 分 析 工 作 是 一 个 耗 时 而 且 消 耗 便 件 资源 的 过 程 ， 既 然 都 
要 在 其 他 机 器 进行 ， 就 没有 必要 受到 命令 行 工具 的 限制 了 ;， 另 一 个 原 
因 是 jhat 的 分 析 功 能 相对 来 说 比较 简陋 ， 后 文 将 会 介绍 到 的 VisualVML， 
以 及 专业 用 于 分 析 dump 文 件 的 Eclipse Memory Analyzer、IBM 
HeapAnalyzer” | 等 工具 ， 都 能 实现 比 jhat 更 强大 更 专业 的 分 析 功 能 。 代 
码 清单 4-3 演 示 了 使 用 jhat 分 析 4.2.4 节 中 采用 jmap 生 成 的 Eclipse IDE 的 内 
存 快照 文件 。 


代码 清单 4-3 ”使 用 jhat 分 析 dump 文 件 


C:\Users\IcyFenix>jhat eclipse.bin 

Reading from eclipse.bin..... 

Dump file created Fri Nov 19 22:07:21 CST 2010 
Snapshot read,resolving...... 

Resolving 1225951 objects...... 

Chasing references,expect 245 dots...... 


Eliminating duplicate references...... 
Snapshot resolved. 

Started HTTP server on port 7000 
Server is ready. 


屏幕 显示 "Server is ready." 的 提示 后 ， 用 户 在 浏览 器 中 键入 
http://localhost:7000/ 就 可 以 看 到 分 析 结 果 ， 如 图 4-3 所 示 。 


A All Classes 《ezcluding platform) ~ Yindows Internet Ezplorer 


OO©O Dd | 局 http filocalhost. T7000 -| Si | 和 | x | 图 后 户 一 天 .wi 这 


资 收藏 突 。 入 和 1 Classes (excluding platf... 答 ” 国 7 了 赎 、 页面 f)， 安 全 6)，I 具 0). 们 "不 区 问 性 


Package org. osgi. service.url 


class org. osgi. service. url. AbstractURL StreamHandlerService [0x5fde8a8] 
class org. osgi. service. url. URLStreamHandlerService [0x5fdd868] 
class org. osgi. service. url. URLStreamHandlerSetter [0x716f858] 


Package org. osgi. util. tracker 


class org. osgi. util. tracker. AbstractTracked [0x5e73888] 

class org. osgi.util. tracker. ServiceTracker [Ox5e702a0] 

class org. osgi. util. tracker. ServiceTracker$l [0x5fb3a50] 

class org. osgi. util. tracker. ServiceTracker$AllTracked [0x5e74090] 
class org. osgi. util. tracker. ServiceTracker} Tracked [0x5e?73c58] 
class org. osgi. util. tracker. ServiceTrackerCustomizer [0x5d2a428] 


Other Queries 


All classes including platform 

Show all members of the rootset 

Show instance counts for all classes (includine platform) 
Show instance counts for all classes (excluding Platform 
Show heap histogram 

Show finalizer summary 

Execute Obiject Query Language (OQL) query 


Ld 


侠 Internet | 保 扩 模 式 : 禁用 


图 4-3 ”jhat 的 分 析 结 


分 析 结 果 默 认 是 以 包 为 单位 进行 分 组 显示 ， 分 析 内 存 泄漏 问题 主 
要 会 使 用 到 其 中 的 "Heap Histogram'" (与 jmap-histo 功 能 一 样 ) 与 OQL 页 


签 的 功能 ， 前 者 可 以 找到 内 存 中 总 容量 最 大 的 对 象 ， 后 者 是 标准 的 对 
象 查 询 语言 ， 使 用 类 似 SQL 的 语法 对 内 存 中 的 对 象 进行 查询 统计 ， 读 
者 奉 对 OQL 有 兴趣 的 话 ， 可 以 参考 本 书 附 了 永 D 的 介绍 。 


[ 匡 用 于 分 析 的 机 器 一 般 也 是 服务 器 ， 由 于 加 载 dump 快 照 文件 需要 比 生 
成 dump 更 大 的 内 存 ， 所 以 一 般 在 64 位 JDK、 大 内 存 的 服务 器 上 进行 。 
[2]JIBM HeapAnalyzer 用 于 分 析 IBM J9 虚 拟 机 生成 的 映像 文件 ， 各 个 虚 
拟 机 产生 的 映像 文件 格式 并 不 一 致 ， 所 以 分 析 工 具 也 不 能 通用 。 


4.2.6 jstack: Java 推 栈 跟踪 工具 


jstack (Stack Trace for Java) 命令 用 于 生成 虚拟 机 当前 时 刻 的 线程 
快照 (一 般 称 为 threaddump 或 者 javacore 文 件 ) 。 线 程 快照 就 是 当前 虚 
拟 机 内 每 一 条 线程 正在 执行 的 方法 堆栈 的 集合 ， 生 成 线程 快照 的 主要 
目的 是 定位 线程 出 现 长 时 间 停 顿 的 原因 ， 如 线程 间 死 锁 、 死 循环 、 请 
求 外 部 资源 导致 的 长 时 间 等 待 等 都 是 导致 线程 长 时 间 停 顿 的 常见 原 
。 线程 出 现 停 顿 的 时 候 通 过 jstack 来 查看 各 个 线程 的 调用 堆栈 ， 就 可 
以 知道 没有 响应 的 线程 到 底 在 后 台 做 些 什么 事情 ， 或 者 等 待 着 什么 资 
源 。 


jstack 命 令 格式 : 


jstack[option]vmid 


option 选 项 的 合法 值 与 具体 含义 见 表 4-5 。 


表 4-5 jstack 工具 主要 选项 


选 项 作 用 
-F | 当 正 常 输出 的 请 求 不 被 响应 时 ， 强 制 输出 线程 堆栈 


| 除 堆 栈 外 ， 显 示 关 于 锁 的 附加 信息 
如 果 调 用 到 本 地 方法 的 话 ， 可 以 显示 C/C++ 的 堆栈 


代码 清单 4-4 是 使 用 jstack 查 看 Eclipse 线程 堆栈 的 例子 ， 例 子 中 的 
3500 是 通过 jps 命 令 查询 到 的 LVMID。 


代码 清单 4-4 使 用 jstack 查 看 线程 堆栈 (部 分 结果 ) 


C:\Users\IcyFenix>jstack-] 3500 

2010-11-19 23:11:26 

Full thread dump Java HotSpot (TM) 64-Bit Server VM (17.1-b03 
mixed mode) : 

"[ThreadPool Manager]-Idle Thread"daemon prio=6 
tid=0x0000000039dd4000 nid=0xf50 in Object.wait() 
[Ox000000003c96f000] 

java.lang.Thread.State:wAITING (on object monitor) 

at java.lang.Object.wait (Native Method) 

-waiting on<0x0000000016bdcc69> (a 
org.eclipse.equinox.internal.util.impl.tpt.threadpool.Executor) 

at java.lang.Object.wait (Object.java:485) 

at 
org.eclipse.equinox.internal.util.impl.tpt.threadpool.Executor.run 

(Executor .java:106) 

-1ocked<0x0000000016bdcc60> (a 
org.eclipse.equinox.internal.util.impl.tpt.threadpool.Executor) 

Locked ownable Synchronizers : 

-None 


在 JDK 1.5 中 ，java.lang.Thread 类 新 增 了 一 个 getAllStackTraces() 方 

法 用 于 获取 虚拟 机 中 所 有 线程 的 StackTraceElement 对 象 。 使 用 这 个 方法 

可 以 通过 简单 的 几 行 代码 就 完成 jstack 的 大 部 分 功能 ， 在 实际 项 目 中 不 

妨 调用 这 个 方法 做 个 管理 员 页 面 ， 可 以 随时 使 用 浏览 器 来 碍 看 线程 堆 
栈 ， 如 代码 清单 4-5 所 示 ， 这 是 笔者 的 一 个 小 经 验 。 


代码 清单 4-5 ”查看 线程 状况 的 JSP 页 面 


<%Q@page import="java.util.Map"%> 


<html> 

<head> 

<title> 服 务 器 线程 信息 </title> 
</head> 

<body> 


<pre> 


<% 

for (Map.Entry<Thread,StackTraceElement[]>stackTrace:Thread. 

getA11StackTraces().entrySet()) { 

Thread thread= (Thread) stackTrace .getKey(); 

StackTraceElement[]stack= (StackTraceElement[]) 
stackTrace.getValue( ); 


if (thread.equals (Thread.currentThread()) ) { 
continue; 


out .print ("\n 线 程 :"+thread.getName()+"\n") ; 
for (StackTraceElement element:stack) { 
out.print ("\t"+element+"\n") ; 

} 

} 


%> 
</pre> 
</body> 
</html> 


4.2.7 HSDIS: JIT 生 成 代码 反 汇 编 


行 过 程 、 执 行 前 后 对 操作 数 栈 、 局 部 变量 表 的 影响 等 细节 。 这 些 细 市 
描述 与 Sun 的 早期 虚拟 机 (Sun Classic VM) 高 度 吻 合 ， 但 随 着 技术 的 
发 展 ， 高 性 能 虚拟 机 真正 的 细节 实现 方式 已 经 渐渐 与 虚拟 机 规范 所 描 
述 的 内 容 产 生 了 越 来 越 大 的 震 距 ， 虚 拟 机 规范 中 的 描述 逐 源 成 了 虚拟 
机 实现 的 “概念 模型 "> 一 一 即 实现 只 能 保证 规范 描述 等 效 。 基 于 这 个 原 
因 ， 我 们 分 析 程序 的 执行 语义 问题 (虚拟 机 做 了 什么 ) 时 ， 在 字 节 码 
层面 上 分 析 完 全 可 行 ， 但 分 析 程序 的 执行 行为 问题 (虚拟 机 是 怎样 做 
的 、 性 能 如 何 ) 时 ， 在 字 万 码 层面 上 分 析 就 没有 什么 意义 了 ， 需 要 通 
过 其 他 方式 解决 。 


分 析 程 序 如 何 执行 ， 通 过 软件 调试 工具 (GDB、Windbg 等 ) 来 断 
点 调试 是 最 常见 的 手段 ， 但 是 这 样 的 调试 方式 在 Java 庶 拟 机 中 会 遇 到 
很 大 困难 ， 因 为 大 量 执行 代码 是 通过 JIT 编 译 器 动态 生成 到 CodeBuffer 
中 的 ， 没 有 很 简单 的 手段 来 处 理 这 种 混合 模式 的 调试 (不 过 相信 虚拟 
机 开发 团队 内 部 肯定 是 有 内 部 工具 的 ) 。 因 此 ， 不 得 不 通过 一 些 特别 
的 手段 来 解决 问题 ， 基 于 这 种 背景 ， 本 节 的 主角 一 HSDIS 揪 件 就 正 
式 登场 了 。 


HSDIS 是 一 个 Sun 官 方 推荐 的 HotSpot 虚 拟 机 JIT 编 译 代码 的 反 汇 编 
插件 ， 它 包含 在 HotSpot 虚 拟 机 的 源码 之 中 ， 但 没有 提供 编译 后 的 程 
序 。 在 Project Kenai 的 网 站 上 也 可 以 下 载 到 单独 的 源码 。 它 的 作用 是 让 
HotSpot 的 -XX:+PrintAssembly 指 令 调 用 它 来 把 动态 生成 的 本 地 代码 还 
原 为 汇编 代码 输出 ， 同 时 还 生成 了 大 量 非常 有 价值 的 注释 ， 这 样 我 们 
就 可 以 通过 输出 的 代码 来 分 析 问 题 。 读 者 可 以 根据 目 己 的 操作 系统 和 
CPU 类 型 从 Project Kenai 的 网 站 上 下 载 编译 好 的 插件 ， 直 接 放 到 
JDK_HOME/jre/bin/client 和 JDK_HOME/jre/bin/server 目 录 中 即 可 。 如 
果 没 有 找到 所 需 操 作 系 统 〈 璧 如 Windows 的 就 没有 ) 的 成 品 ， 那 就 得 
自己 使 用 源码 编译 一 下 5 。 


还 需要 注意 的 是 ， 如 果 读 者 使 用 的 是 Debug 或 者 FastDebug 版 的 
HotSpot， 那 可 以 直接 通过 -XX:+PrintAssembly 指 令 使 用 插件 ， 如 果 使 
用 的 是 Product 版 的 HotSpot， 那 还 要 额外 加 入 一 个 - 
XX:+UnlockDiagnosticVMOptions 参 数 。 笔 者 以 代码 清单 4-6 中 的 简单 
测试 代码 为 例 演 示 一 下 这 个 插件 的 使 用 。 


代码 清单 4-6 ”测试 代码 


public class Bart{ 

int a=1; 

static int b=2; 

public int sum (int c) { 

return a+b+c; 

public static void main (String[]args) { 
new Bar().sum (3) ; 


oy 


编译 这 段 代 码 ， 并 使 用 以 下 命令 执行 。 


Java-XX:+PrintAssembly-Xcomp-XX:CompileCommand=dontinline, 
*Bar.sum-XX:Compi leCommand=compileonly, *Bar.sum test.Bar 


其 中 ， 参 数 -Xcomp 是 让 虚拟 机 以 编译 模式 执行 代码 ， 这 样 代码 可 
以 * 偷 籁 ”， 不 需要 执行 足够 次 数 来 预 热 就 能 触发 JIT 编 译 引 。 两 个 - 
XX:CompileCommand 意 思 是 让 编译 髓 不 要 内 联 sum0 并 且 只 编译 
sum()，-XX:+PrintAssembly 束 是 输出 反 汇 编 内 容 。 如 果 一 切 顺利 的 
话 ， 那 么 屏幕 上 会 出 现 类 似 下 面 代 码 清单 4-7 所 示 的 内 容 。 


代码 清单 4-7 测试 代码 


[Disassembling for mach='1386 ' ] 

[Entry Point] 

[Constants] 

#{method}'sum'' (I) I'in'test/Bar' 
#this:ecx='test/Bar' 

#parmO :edx=int 

#[sp+0x20] (sp of caller) 

OxO1lcac407:cmp QOx4 (%ecx) ，%eax 
OxO1icac40a:jne 0x01c6b050; {runtime_call} 
[Verified Entry Point] 
OxO1lcac410:mov%eax, -OQx8000 (%esp) 
0x01cac417:push%ebp 

OxO1lcac418:sub$0x18, %esp; *aload_0 

; -test.Bar:sumQ@0 (line 8) 

; block B0[0，10] 

0x01cac41b :mov QOx8 (%ecx) , %eax; *getfield a 
; -test.Bar:sum@1 (line 8) 
OxO1icac41ie:mov$0Ox3d2fad8, %esi; {oop (a 


'java/lang/Class'='test/Bar') } 

OxO1lcac423:mov Qx68 (%esi) , %esi; *getstatic b 
; -test.Bar:sum@4 (line 8) 

OxO1icac426:add%esi, %eax 

OxO1icac428:add%edx, %eax 

OxO1lcac42a:add$0x18, %esp 

OxO1icac42d:pop%ebp 


OxO1icac42e:test%eax, Ox2b0100; {poll_return} 
OxO1lcac434:ret 


上 上 段 代码 并 不 多 ， 下 面 一 句 句 进行 说 明 。 

1) mov%eax，-0x8000 (%esp) : 检查 栈 洲 。 
2) push%ebp: 保存 上 一 栈 帧 基 址 。 

3) sub$0x18，%esp: 给 新 帧 分 配 空间 。 


4) mov 0x8 (%ecx) ，%eax: 取 实 例 变量 a， 这 里 0x8 (%ecx) 
瓯 是 ecx+0x8 的 意思 ， 前 面 "[Constants]" 中 提示 
了 "this:ecx='tesVBar"， 即 ecx 寄 存 器 中 放 的 就 是 this 对 象 的 地 址 。 偏 移 
0x8 是 越过 this 对 象 的 对 象 头 ， 之 后 就 是 实例 变量 a 的 内 存 位 置 。 这 次 是 
访问 “Java 堆 ”中 的 数据 。 


5) mov$0x3d2fad8 ，%esi: 有 取 test.Bar 在 方法 区 的 指针 。 


6) mov 0x68 (%esi) ，%esi: 取 类 变量 bp， 这 次 是 访问 “方法 
区 ”中 的 数据 。 


7) add%esi，%eax 和 add%edx，%eax: 做 两 次 加 法 ， 求 a+b+c 的 
值 ， 前 面 的 代码 把 a 放 在 eax 中 ， 把 b 放 在 esi 中 ， 而 c 在 [Constants] 中 提示 
了 ，"parm0:edx=int"， 说 明 c 在 edx 中 。 


8) add$0x18，%esp: 撤销 栈 帧 。 

9) pop%ebp: 恢复 上 一 栈 帧 。 

10) test%eax，0x2b0100: 轮 询 方法 返回 处 的 SafePoint 。 
11) ret: 方法 返回 。 


[1 |Project Kenai: http://kenai.com/projects/base-hsdis ° 

[2IJHLLVM 圈 子 中 有 已 编译 好 的 : http://hllvm.group.iteye.com/。 
[3]-Xcomp 在 较 新 的 HotSpot 中 被 移 除 了 ， 如 果 读 者 的 虚拟 机 无 法 使 用 
这 个 参数 ， 请 加 个 循环 预 热 代码 ， 触 发 JIT 编 译 。 


4.3 JDK 的 可 视 化 工具 


JDK 中 除了 提供 大 量 的 命令 行 工具 外 ， 还 有 两 个 功能 强大 的 可 视 化 
工具 : JConsole 和 VisualVM， 这 两 个 工具 是 JDK 的 正式 成 员 ， 没 有 被 贴 


上 "unsupported and experimental" 的 标签 。 


其 中 JConsole 是 在 JDK 1.5 时 期 束 已 经 提供 的 虚拟 机 监控 工具 ， 而 
VisualVM 在 JDK 1.6 Update7 中 才 百 次 发 布 ， 现 在 已 经 成 为 Sun 
(Oracle) 主力 推动 的 多 合 一 故障 处 理工 具 岂 ， 并 且 已 经 从 JDK 中 分 离 
出 来 成 为 可 以 独立 发 展 的 开源 项 目 。 


为 了 避免 本 市 的 讲解 成 为 对 软件 说 明文 档 的 简单 翻译 ， 笔 者 准备 
了 一 些 代 码 样 例 ， 都 是 笔者 特意 编写 的 “反面 教材 ”。 后 面 将 会 使 用 这 
两 款 工 具 去 监控 、 分 析 这 几 段 代码 存在 的 问题 ， 算 十 本 市 简单 的 实战 
分 析 。 读 者 可 以 把 在 可 视 化 工具 观察 到 的 数据 、 现 象 ， 与 前 面 两 章 中 
讲解 的 理论 知识 互相 印证 。 


4.3.1 JConsole: Java 监 视 与 管理 控制 台 


JConsole (Java Monitoring and Management Console) 是 一 种 基于 
JMX 的 可 视 化 监视 、 管 理工 具 。 它 管理 部 分 的 功能 是 针对 JMX MBean 
进行 管理 ， 由 于 MBean 可 以 使 用 代码 、 中 间 件 服务 句 的 管理 控制 全 或 


者 所 有 人 符合 JMX 规 施 的 软件 进行 访问 ， 所 以 本 市 将 会 看 重 介绍 JConsole 


监视 部 分 的 功能 。 

1. 启 动 JConsole 

通过 JDK/bin 目 录 下 的 "jconsole.exe" 启 动 JConsole 后 ， 将 目 动 搜索 出 
本 机 运行 的 所 有 虚拟 机 进程 ， 不 需要 用 户 自己 再 使 用 jps 来 查询 了 ， 如 


图 4-4 所 示 。 双 击 选择 其 中 一 个 进程 即 可 开始 监控 ， 也 可 以 使 用 下 面 
的 “远程 进程 ”功能 来 连接 远程 服务 絮 ， 对 远程 虚拟 机 进行 监控 。 


PID 
sun. tools. jconsole. JConsole 4068 


org. eclipse. equinox. launcher 1.1.0.w201005... 296 


com. EezrlXxsoEt. morltorizE. NornltorliETeSt 2228 


图 4-4 JConsole 连 接 页 面 


从 图 4-4 可 以 看 出 ， 笔 者 的 机 器 现在 运行 了 Eclipse、JConsole 和 
MonitoringTest 三 个 本 地 虚拟 机 进程 ， 其 中 MonitoringTest 就 是 笔者 准备 
的 “反面 教材 ”代码 之 一 。 双 击 它 进入 JConsole 主 界面 ， 可 以 看 到 主 界面 


里 共 包 括 “ 概 壕 ” S “内 存 ” x “线程 ” SS “类 ” RS “VM 摘要 ” 去 "MBean"6 个 页 
签 ， 如 图 4-5 所 示 。 


| 到 Java 监视 和 管理 控制 台 - pid: 2568 com. fenixsoft. monitoring. MonitoringTest 
| 名 连接 窗口 帮助 
概述 | 内 存 | 线程 | 类 | W 摘要 | WBean 


时 间 范 围 : 二 

摊 内 存 使 用 情况 

100 Nb 

80 Mb 

60 Mb 

40 Nb 

20 Mb 
0.0 Mb 


已 使 用 : 24.2 哪 已 提交: ”101.4 I 最 大 信 : 101.4 Im 


图 4-5 JConsole 主 界面 


“概述 "页 签 显示 的 是 整个 虚拟 机 主要 运行 数据 的 概览 ， 其 中 包 
括 " 堆 内 存 使 用 情况 ”、“ 线 程 * “类 ”、“CPU 使 用 情况 "4 种 信息 的 曲线 
图 ， 这 些 曲线 图 是 后 面 “内 存 ”、“ 线 程 * “类 * 页 签 的 信息 汇总 ， 具 体内 
容 将 在 后 面 介绍 。 


2. 内 存 监控 


“内 存 ” 页 签 相当 于 可 视 化 的 jstat 命 令 ， 用 于 监视 受 收 集 器 管理 的 虚 
拟 机 内 存 (Java 堆 和 永久 代 ) 的 变化 趋势 。 我 们 通过 运行 代码 清单 4-8 
中 的 代码 来 体验 一 下 它 的 监视 功能 。 运 行 时 设置 的 虚拟 机 参数 为 ，- 
Xms100m-Xmx100m-XX:+UseSerialGC， 这 上 段 代 码 的 作用 是 以 64KB/50 
毫秒 的 速度 往 Java 堆 中 填充 数据 ， 一 共 填 充 1000 次 ， 使 用 JConsole 
的 “内 存 ” 页 签 进行 监视 ， 观 察 曲线 和 柱状 指示 图 的 变化 。 


代码 清单 4-8 ”JConsole 监 视 代 码 


A 
* 内 存 占 位 符 对 象 ， 一 个 00MObject 大 约 占 64KB 
5/ 


static class OOMObject{ 
public byte[]jplaceholder=new byte[64*1024] ; 
} 


public static void fillHeap (int num) throws 
InterruptedException{ 

List<OOMObject>1ist=new ArrayList<0O0OMObject> (); 

for (int i=0; i<num; i++) 

// 稍 作 延 时 ， 令 监视 曲线 的 变化 更 加 明显 

Thread.sleep (50) ; 

list.add (new 00Mobject()) ; 


System. gc( ); 
} 


public static void main (String[]args) throws Exceptiont{ 
fillHeap (1000) ; 
} 


程序 运行 后 ， 在 “内 存 ” 页 签 中 可 以 看 到 内 存 池 Eden 区 的 运行 趋势 
呈现 折线 状 ， 如 图 4-6 所 示 。 而 监视 范围 扩大 至 整个 堆 后 ， 会 发 现 曲 线 


是 一 条 向 上 增长 的 平滑 曲线 。 并 且 从 柱状 图 可 以 看 出 ， 在 1000 次 循环 
执行 结束 ， 运 行 了 System.gcO 后 ， 虽 然 整 个 新 生 代 Eden 和 Survivor 区 都 
基本 被 清空 了 ， 但 是 代表 老年 代 的 柱状 图 仍然 你 持 峰 值 状 态 ， 说 明 被 
填充 进 堆 中 的 数据 在 System.gc() 方 法 执行 之 后 仍然 存活 。 笔 者 的 分 析 到 
此 为 止 ， 现 提 两 个 小 问题 供 读者 思考 一 下 ， 答 案 稍 后 给 出 。 


1) 虚拟 机 启动 参数 只 限制 了 Java 堆 为 100MB， 没 有 指定 -Xmn 参 


) 
数 ， 能 否 从 监控 图 中 估计 出 新 生 代 有 多 大 ? 


2) 为 何 执行 了 System.gc0 之 后 ， 图 4-6 中 代表 老年 代 的 柱状 图 仍然 
显示 峰值 状态 ， 代 码 需 要 如 何 调整 才能 让 System.gc() 回 收 挥 填充 到 堆 中 
的 对 象 ? 


已 必用 
4 1,661,592 : 


时 间 : 2010-11-20 19:48:54 
已 使 用 : 1, 353 Kb 
分 配 : 27, 328 Kb 
最 大 值 : 27, 328 Kb 
GC 时 间 : Copy (2 项 收集 ) 所 用 的 时 间 
为 0.083 种 
MarkSweepCompact 《1 项 收集 》 所 用 的 时 间 
为 0.054 种 


图 4-6 Eden 区 内 存 变 化 状况 


问题 1 答案 : 图 4-6 显 示 Eden 空 间 为 27 328KB， 因 为 没有 设置 - 
XX:SurvivorRadio 参 数 ， 所 以 Eden 与 Survivor 空 间 比 例 为 默认 值 8:1， 整 
个 新 生 代 空间 大 约 为 27 328KBx125%=34 160KB 。 


问题 2 答案 : 执行 完 System.gc0 之 后 ， 空 间 未 能 回收 是 因为 List< 
OOMObject > list 对 象 仍然 存活 ，flHeap0 方 法 仍然 没有 退出 ， 因 此 flist 


对 象 在 System.gc0 执 行 时 仍然 处 于 作用 域 之 内 3。 如 果 把 System.gc0 移 
动 到 flHeap(0) 方 法 外 调用 就 可 以 回收 掉 全 部 内 存 。 


3. 线 程 监控 


如 条 上 面 的 内存? 页 等 相当 于 可 视 化 的 jstat 命 令 的 话 , “线程 ” 页 签 
的 功能 相当 于 可 视 化 的 jstack 命 令 ， 遇 到 线程 停顿 时 可 以 使 用 这 个 页 签 
进行 监控 分 析 。 前 面 讲解 jstack 命 令 的 时 候 提 到 过 线程 长 时 间 停顿 的 主 
要 原因 主要 有 : 等 竺 外 部 资源 (数据 库 连 接 、 网 络 资 源 、 设 备 资 源 
等 ) 、 死 循环 、 锁 等 待 〈 活 锁 和 死 锁 ) 。 通 过 代码 清单 4-9 分 别 演示 一 
下 这 几 种 情况 。 


代码 清单 4-9 ”线程 等 行 演 示 代 码 


ps 
* 线 程 死 循环 演示 
*/ 


public static void createBusyThread( ){ 
Thread thread=new Thread (new Runnable(){ 
Q@Override 

public void run(){ 

while (true) // 第 41 行 


} 
}, "testBusyThread") ; 
thread. start(); 


} 

/** 

* 线 程 锁 等 待 演示 
*/ 


public static void createLockThread (final Object lock) { 
Thread thread=new Thread (new Runnab1le(){ 

@Override 

public void run(){ 

synchronized (lock) { 


tryt{ 
lock .wait( ); 


}catch (InterruptedException e) { 
e.printStackTrace( ); 

} 

} 


}, "testLockThread") ; 

thread. start(); 

} 

public static void main (String[]args) throws Exceptiont{ 

BufferedReader br=new BufferedReader (new InputStreamReader 
(System.in) ) ; 

br.readLine( ); 

createBusyThread ( ); 

br.readLine( ); 

Object obj=new Object( ); 

createLockThread (obj) ; 

} 


程序 运行 后 ， 首 先 在 “线程 ”页 签 中 选择 main 线 程 ， 如 图 4-7 所 示 。 
堆栈 追踪 显示 BufferedReader 在 readBytes 方 法 中 等 得 System.in 的 键盘 输 
入 ， 这 时 线程 为 Runnable 状 态 ，Runnable 状 态 的 线程 会 被 分 配 运 行 时 
间 ， 但 readBytes 方 法 检查 到 流 没 有 更 新 时 会 立刻 归还 执行 令 牌 ， 这 种 
等 行 只 消耗 很 小 的 CPU 资源 。 


线程 | 
Pr 1: i 

Reference Handler 状态 : RUNNABLE 
Finalizer 阻塞 总 数 : 0 ”等 待 总 数 : 0 
| Sienal Dispatcher 


Attach Listener So 
| testBusyThresd 堆栈 追踪 : 


| EMI ICP Accept-0 “java. 1i0.FileInputStream. readBytes (Native Method) 
BMI TCP Conmection(1)-192. 168 java. io.FileInput Stream. read(FileInputStream. java: 199) 
| EMI Scheduler (0) java. i0, BufferedInput Stream. readl (BufferedInput Streanm. java: 256) 


| Hi 全 几 | 


图 。 4-7 _ main 线程 


接着 监控 testBusyThread 线 程 ， 如 图 4-8 所 示 ，testBusyThread 线 程 一 
直 在 执行 空 循环 ， 从 堆栈 追踪 中 看 到 一 直 在 MonitoringTest.java 代 码 的 
41 行 停留 ，41 行 为 : while (true) 。 这 时 候 线程 为 Runnable 状 态 ， 而且 
没有 归还 线程 执行 令 牌 的 动作 ， 会 在 空 循环 上 用 尽 全 部 执行 时 间 直 到 
线程 切换 ， 这 种 等 待 会 消耗 较 多 的 CPU 资源 。 


线程 
main 1: testBusyIhread 


Reference Handler : RUNNABLE | 
Finalizer 总 数 : 0 ”等待 总 数 : 0 | 
| 
| 


a 


Sienal Dispatcher |= 


Attach Listener 


| lo. | 
teastBusyThr ead | 追踪 : | 
RMI ICP Accept-0 (fenixsoft.monitoring. MonitoringTest$1. run (ENE SO EE | 


RMI ICP Cormection(1)-192. 168 h. lang. Ihread. run (Thread. java: 662) 
RMI Scheduler (0) 


4 | 加 | + 站 | 


图 4-8 testBusyThread 线 程 


图 4-9 显 示 testLockThread 线 程 在 等 待 着 lock 对 象 的 notify 或 notifyAll 
方法 的 出 现 ， 线 程 这 时 候 处 于 WAITING 状 态 ， 在 被 唤醒 前 不 会 被 分 配 
执行 时 间 。 


fr 

线程 | 

Attach Listener 1 名 称 : testLockThread 名 
testBusyThread 找 态 : WAITING 在 java. lang.0bject@3c83ad0 上 

RMI ICP Accept-0 _ | 阻塞 总 数 : 0 等待 总 数 : 1 


RMI ICP Conmnection (1)-192. 168. 
RNI Scheduler (0) 

JWMX server connection timeout 
RMI ICP Conmection CC)-192. 168 
RMI TCP Connection(S5)-192. 168. java. lang.Object. wait (0bject. java: 485) 
tastLocklhread 
4 | mh 


堆栈 追踪 : 
java. lang. Object. wait (Native Method) 


WN 


com. fenixsoft.monitoring. MonitoringTest$2. run(MonitoringIlest. java: ™ 
. 4 器 


1 


图 4-9 testLockThread 线 程 


testLockThread 线 程 正 在 处 于 正常 的 活 锁 等 待 ， 只 要 ]ock 对 象 的 
notify0 或 notifyAl10 方 法 被 调用 ， 这 个 线程 便 能 激活 以 继续 执行 。 代 码 
清单 4-10 演 示 了 一 个 无 法 再 被 激活 的 死 锁 等 待 。 


代码 清单 4-10 ” 死 锁 代 码 样 例 


7 

* 线 程 死 锁 等 待 演示 

*/ 

static class SynAddRunalbe implements Runnablet{ 
int a,b; 

public SynAddRunalbe (int a,int b) { 

this.a=a; 

this.b=b; 

} 

Q@Override 

public void run(){ 

synchronized (Integer .Valueof (a) ) 
synchronized (Integer.valueOof (b) ) 
System.out.println (a+b) ; 

} 

} 

} 

} 

public static void main (String[]args) { 

for (int i=0; i<100; i++) { 

new Thread (new SynAddRunalbe (1, 2) ) .start(); 
new Thread (new SynAddRunalbe (2, 1) ) .start(); 
} 

} 


{ 
{ 


这 段 代码 开 了 200 个 线程 去 分 别 计算 1+2 以 及 2+1 的 值 ， 其 实 for 循 环 
是 可 省 略 的 ， 两 个 线程 也 可 能 会 导致 死 锁 ， 不 过 那样 概率 太 小 ， 需 要 
沦 试 运行 很 多 次 才能 看 到 效果 。 一 般 的 话 ， 带 for 循 环 的 版 本 最 多 运行 


2~3 次 就 会 遇 到 线程 死 锁 ， 程 序 无 法 结束 。 造 成 死 锁 的 原因 是 
Integer.valueOf() 方 法 基于 减少 对 象 创建 次 数 和 节省 内 存 的 考虑 ， 
[-128，127] 之 间 的 数字 会 被 缓存 31， 当 valueOf() 方 法 传 入 参数 在 这 个 范 
围 之 内 ， 将 直接 返回 缓存 中 的 对 象 。 也 就 是 说 ， 代 码 中 调用 了 200 次 
IntegervalueOfO 方 法 一 共 就 只 返回 了 两 个 不 同 的 对 象 。 假 如 在 某 个 线 
程 的 两 个 synchronized 块 之 间 发 生 了 一 次 线程 切换 ， 那 就 会 出 现 线程 A 
等 着 被 线程 B 持 有 的 IntegervalueOf (1) ， 线 程 B 又 等 着 被 线程 A 持 有 的 
IntegervalueOf (2) ， 结 果 出 现 大 家 都 跑 不 下 去 的 情景 。 


出 现 线程 死 锁 之 后 ， 点 击 JConsole 线 程 面 板 的 “检测 到 死 锁 ?按钮 ， 
将 出 现 一 个 新 的 “ 死 锁 ”页 签 ， 如 图 4-10 所 示 。 


线程 | 死 锁 

Thread-199 1 名 称 : Ihread-43 

状态 : BLOCKED 在 java. lang. Integer@7cbdb375 上 ， 拥有 者 : Thread-12 
Thread-12 


阻塞 总 数 : 1 等 待 总 数 : 0 


堆栈 追踪 

Com. fenixsoft.monitoring. IhreadDeadLocklest$SynAddRunalbe. run(Ihrl| 
-~ 已 锁定 java. lang. Integer@76c3358b 

| java. Lang, IThread. run(Thread. java: 662) 


图 4-10 线程 死 锁 


图 4-10 中 很 清晰 地 显示 了 线程 Thread-43 在 等 待 一 个 被 线程 Thread- 
12 持 有 Integer 对 象 ， 而 点 击 线程 Thread-12 则 显示 它 也 在 等 待 一 个 Integer 
对 象 ， 被 线程 Thread-43 持 有 ， 这 样 两 个 线程 就 互相 卡 住 ， 都 不 存在 等 
到 锁 释 放 的 希望 了 。 


[1]VisualVM 官 方 站 点 : https:/visualvm.devjava.net/ 。 

[2] 准 确 地 说 ， 只 有 在 虚拟 机 使 用 解释 句 执 行 的 时 候 , “在 作用 域 之 
内 ”才能 保证 它 不 会 被 回收 ， 因 为 这 里 的 回收 还 涉及 局 部 变量 表 Slot 复 
用 、 即 时 编译 器 介入 时 机 等 问题 ， 具 体 读 者 可 参考 第 8 章 中 关于 局 部 变 
量 表 内 存 回收 的 例子 。 

[3] 默 认 值 ， 实 际 值 取 决 于 java.lang.Integer.IntegerCache.high 参 数 的 设 
加 。 


4.3.2 ”VisualVM: 多 合 一 故障 处 理工 具 


VisualVM (All-in-One Java Troubleshooting Tool) 是 到 目前 为 止 随 
JDK 发 布 的 功能 最 强大 的 运行 监视 和 故障 处 理 程序 ， 并 且 可 以 预见 在 未 
来 一 段 时 间 内 都 是 官方 主力 发 展 的 虚拟 机 故障 处 理工 具 。 官 方 在 
VisualVM 的 软件 说 明 中 写 上 了 "All-in-One" 的 描述 字样 ， 预 示 着 它 除了 
运行 监视 、 故 障 处 理 外 ， 还 提供 了 很 多 其 他 方面 的 功能 。 如 性 能 分 析 

(Profiling) ，VisualVM 的 性 能 分 析 功 能 甚至 比 起 JProfiler、YourKit 等 
专业 且 收 费 的 Profiling 工 具 都 不 会 逊色 多 少 ， 而 且 VisualVM 的 还 有 一 个 
很 大 的 优点 : 不 需要 被 监视 的 程序 基于 特殊 Agent 运 行 ， 因 此 它 对 应 用 
程序 的 实际 性 能 的 影响 很 小 ， 使 得 它 可 以 直接 应 用 在 生产 环境 中 。 这 
个 优点 是 JProfiler、YourKit 等 工具 无 法 与 之 媲美 的 。 


1.VisualVM 兼 容 范 围 与 插件 安装 


VisualVM 基 于 NetBeans 平 台 开 发 ， 因 此 它 一 开始 就 具备 了 插件 扩 
展 功 能 的 特性 ， 通 过 插件 扩展 支持 ，VisualVM 可 以 做 到 : 


显示 虚拟 机 进程 以 及 进程 的 配置 、 环 境 信息 (jps 、jinfo) 。 


监视 应 用 程序 的 CPU、GC、 堆 、 方 法 区 以 及 线程 的 信息 (jstat 、 


jstack) 。 


dump 以 及 分 析 堆 转 储 快照 \jmap、jhat) 。 


方法 级 的 程序 运行 性 能 分 析 ， 找 出 被 调用 最 多 、 运 行 时 间 最 长 的 
方法 。 


离线 程序 快照 : 收集 程序 的 运行 时 配置 、 线 程 dump、 内 存 dump 等 
言 息 建立 一 个 快照 ， 可 以 将 快照 发 送 开发 者 处 进行 Bug 反 馈 。 


其 他 plugins 的 无 限 的 可 能 性 .……… 


> 


VisualVM 在 JDK 1.6 update 7 中 才 首 次 出 现 ， 但 并 不 意味 着 它 只 能 
监控 运行 于 JDK 1.6 上 的 程序 ， 它 具备 很 强 的 向 下 兼容 能 力 ， 甚 至 能 向 
下 兼容 至 近 10 年 前 发 布 的 JDK 1.4.2 平 台 !1， 这 对 无 数 已 经 处 于 实施 、 
维护 的 项 目 很 有 意义 。 当 然 ， 并 非 所 有 功能 都 能 完美 地 向 下 兼容 ， 主 
要 特性 的 兼容 性 见 表 4-6 。 


表 4-6 VisualVM 主要 特性 的 兼容 性 列表 


JDK 1.4.2 JDK 1.5 JDK 1.6 local JDK 1.6 remote 
运行 环境 信息 | vy 


系统 属性 


监视 面板 


线程 面板 


MBean 管理 


性 能 监控 
、 线 程 Dump 


JConsole 插 价 


首次 局 动 VisualVM 后 ， 读 者 先 不 必 着 急 找 应 用 程序 进行 监测 ， 
为 现在 VisualVM 还 没有 加 载 任何 插件 ， 虽 然 基 本 的 监视 、 线 程 面 板 的 
功能 主 程序 都 以 默认 插件 的 形式 提供 了 ， 但 是 不 给 VisualVM 装 任何 扩 
展 插件 ， 就 相当 于 放弃 了 它 最 精华 的 功能 ， 和 没有 安 流 任何 应 用 软件 
操作 系统 差不多 。 


插件 可 以 进行 手工 安装 ， 在 相关 网 站 由 上 下 载 *.nbm 包 后 ， 点 击 “ 工 
具 ”> “插件 ”> “已 下 载 " 菜 单 ， 然 后 在 弹出 的 对 话 框 中 指定 nbm 包 路 径 
便 可 进行 安装 ， 插 件 安装 后 存放 在 JDK_HOME/lib/visualvm/visualvm 
中 。 不 过 手工 安装 并 不 常用 ， 使 用 VisualVM 的 自动 安装 功能 已 经 可 以 
找到 大 多 数 所 需 的 插件 ， 在 有 网 络 连接 的 环境 下 ， 点 击 “ 工 具 ” “插件 
沫 单 ”， 弹 出 如 图 4-11 所 示 的 插件 页 签 ， 在 页 签 的 * 可 用 插件 ?中 列举 了 
当前 版 本 VisualVM 可 以 使 用 的 插件， 选中 插件 后 在 右边 窗口 将 显示 这 
个 插件 的 基本 信息 ， 如 开发 者 、 上 版本、 功能 描述 等 。 


WisualWW-Classflish Applicati on 
Java ME Profiler Snap... Java IE SDK 
VisualVWM-Extensions Platform 
VisualVM-Ssmpler Profiline 
BIrsce4Vi sualVM Profiling 
VisualVMSecurity Security 
VisualVM-JConsole Tools 
VisualVM-MBeans Tools 
VisualWM-BufferMonitor Tools 
Visual CC Tools 
SAPlugin Tools 
VisualVM 0S5Gi Plugin Tools 
SysIray Tools 
KillApplication Tools 
VisualWW-JymCapabilities Tools 


激活 (A) | | 取消 激活 0D) | | 郑 载 0D) | 


本 : 1.3 
源 : 而 sualWM 插件 中 心 


插件 描述 


A sample plugin giving an overview of 
advanced monitoring capabilities of 
VisualYM. Enhances monitoring of 
GlassFish application server by adding 
specialized overview, new tab for 
monitorineg HITP Service and the ability 
to visually select and monitor sny of 
the deployed web applications 


国 国 国 国 国 国 国 国 国 国 国 国 国 国 辐 
QOOQOQOOOOOOOOOOE 


海 


图 4-11 VisualVM 插 件 页 签 


大 家 可 以 根据 自己 的 工作 需要 和 兴趣 选择 合适 的 插件 ， 然 后 点 击 
安装 按钮 ， 弹 出 如 图 4-12 所 示 的 下 载 进度 窗口 ， 跟 着 提示 操作 即 可 完成 
安装 。 


下 载 
请 稍 候 ， 直 至 安装 程序 下 载 完 请 求 的 插件 。 


正在 下 载 插件 . . . 


Visual VM-IDA-Library-Component 
在 后 台 运 行 R) 


| 《< 上 一 步 @) | | 。” 支 浇 四 


图 4-12 VisualVM 插 件 安 装 过 程 


安装 完 插件， 选择 一 个 需要 监视 的 程序 就 进入 程序 的 主 界面 了 ， 
如 图 4-13 所 示 。 根 据 读 者 选择 安装 插件 数量 的 不 同 ， 看 到 的 页 签 可 能 和 
图 4-13 中 的 有 所 不 同 。 


文件 @) 应 用 程序 A) 视图 WV) 工具 G) 窗口 w) 都 助 00 
: 功 届 : 久 留 午 准 


日 厦 本 地 
[和 矶 saalym 
-外 orE. eclipse. equi 


C org. eclipse. equinox. launcher. Main {pid 10112) 
概述 加 保存 的 数据 “加 | 详细 信息 


PID: 10112 

主机 : localhost 

主 类 - org eclipse. equinox. launcher. MMain 

参数 : -os win32 -ws win32 -areh x86 -showsplash -launcher D:\ DevSpace\Eclipse 3.5\ecli 


JVN: Java HotSpot (IM) Client WW (17 0-b16，mixed mode, sharing) 
Java Home 目录 : 了 D:\ DevSpace\jadki.6.0 21\jre 
JI 标志 : “< 无 > 
出 现 00ME 时 生成 堆 dump: 禁用 
JW 参数 | 系统 属性 | JWN capabilities 
-Dosgi. requiredJavaVersion=l.5 


-Imzx512m 
-~Ims512m 


x 
D 
- 


图 4-13 VisualVM 主 界面 


VisualVM 中 “概述 ”、“ 监 视 ”、“ 线 程 ”、"MBeans" 的 功能 与 前 面 介 
绍 的 JConsole 差 别 不 大 ， 读 者 根据 上 文 内 容 类 比 使 用 即 可 ， 下 面 挑选 几 
个 特色 功能 、 插 件 进 行 介绍 。 


2. 生 成 、 浏 哎 堆 转 储 快照 


在 VisualVM 中 生成 dump 文 件 有 两 种 方式 ， 可 以 执行 下 列 任 一 操 
作 : 


在 “应 用 程序 ”窗口 中 右键 单 击 应 用 程序 节点 ， 然 后 选择 “ 堆 
Dump”。 


在 * 应 用 程序 "窗口 中 双击 应 用 程序 节点 以 打开 应 用 程序 标签 ， 然 
后 在 "监视 "标签 中 单 击 “ 堆 Dump”。 


生成 了 dump 文 件 之 后 ， 应 用 程序 页 签 将 在 该 堆 的 应 用 程序 下 增加 
一 个 以 [heapdump] 开 头 的 于 太太， 并 且 在 主页 签 中 打开 了 该 转 储 快照 ， 
如 图 4-14 所 示 。 如 果 需 要 把 dump 文 件 保存 或 发 送出 去 ， 要 在 heapdump 
节 太 上 石 健 选择 “为 存 为 ” 末 单 ， 否 则 当 VisualVM 天 闭 时 ， 生 成 的 dump 
文件 会 被 当做 临时 文件 删除 挥 。 要 打开 一 个 已 经 存在 的 dump 文 件 ， 通 
过 文件 菜单 中 的 “ 凌 入 ?功能 ， 选 择 硬 盘 上 的 dump 文 件 即 可 。 


全 只 起 四 页 号 org eclipse eqainer loneher Main (pid 3312) Hm ¢ WiseslWN | 


气概 述 只 上 败 视 辕 线 得 | A Sonal er | 
EB Jconsole Plugins =|Visual CC 时 [heapdenp] 10:49:28 下 午 
PR sa ™ C VisualVN 
堆 Iunp 


持 嘱 | @ 扩 二 命 类 [9 实例 |@ or 控制 [ 盏 | 四 医 : 


| 使 sunfontTrueTypeFontSDirectoryEntry 实例 数 : 8,830 | 实例 大 小 : 24 | 总 大 小 : 211,920 | 过 草 侠 加 的 大 小 | 


类 型 
TruaTypsFont ， 


TruslypeFont$ 着 > 
TrueTypeFont$ 得 《19 项 ) 


图 4-14 浏览 dump 文 件 


从 堆 页 签 中 的 “摘要 ”面板 可 以 看 到 应 用 程序 dump 时 的 运行 时 参 
数 、System.getProperties() 的 内 容 、 线 程 堆栈 等 信息 ,“ 类 ”面板 则 是 以 
类 为 统计 口径 统计 类 的 实例 数量 、 容 量 信 息 , “实例 ”面板 不 能 直接 使 
用 ， 因 为 不 能 确定 用 户 想 查看 哪个 类 的 实例 ， 所 以 需要 通过 “类 ”面板 
进入 ， 在 “类 ”中 选择 一 个 关心 的 类 后 双击 鼠标 ， 即 可 在 “实例 ”里 面 看 见 
此 类 中 500 个 实例 的 具体 属性 信息 。“OQL 控 制 台 ”面板 中 就 是 运行 OQL 
查询 语句 的 ， 同 jhat 中 介绍 的 OQL 功 能 一 样 。 如 果 和 需要 了 解 具体 OQL 语 
法 和 使 用 ， 可 参见 本 书 附 孙 D 的 内 容 。 


3. 分 析 程 序 性 能 


在 Profiler 页 签 中 ，VisualVM 提 供 了 程序 运行 期 间 方法 级 的 CPU 执 
行 时 间 分 析 以 及 内 存 分 析 ， 做 Profiling 分 析 肯 定 会 对 程序 运行 性 能 有 比 
较 大 的 影响 ， 所 以 一 般 不 在 生产 环境 中 使 用 这 项 功能 。 


要 开始 分 析 ， 先 选择 "CPU" 和 和 “内存” 按钮 中 的 一 个 ， 然 后 切换 到 应 
用 程序 中 对 程序 进行 操作 ，VisualVM 会 记录 到 这 段 时 间 中 应 用 程序 执 
行 过 的 方法 。 如 有 果 是 CPU 分 析 ， 将 会 统计 每 个 方法 的 执行 次 数 、 执 行 
耗 时 ， 如 果 有 是 内 存 分 机 ， 则 会 统计 每 个 方法 关联 的 对 象 数 以 及 这 些 对 
象 所 占 的 空间 。 分 析 结 束 后 ， 点 击 “ 停 止 ?按钮 结束 监控 过 程 ， 如 图 4-15 
Bk 


Me] Javea VissaiWE [eS Es 
文件 @) 应 用 程序 如 视图 WwW) 工具 GD) 窗口 人 帮助 = 一 
和 名目 :名 名 痢 前 

E 应 用 程序 咀 总 | 起 输 页 器 民 到 org. eclipse equinox launcher Wain (pid 312) % 0 Wsoalm 中 | 


= 二 本 IERIFFTIEFTIIRE O rorler [Bee [| Jeoneele Mogine | jwisel Ce 


图 [heapéunp] 10: O org. eclipse. equinox. launcher. Main (pid 3312) 
orE sclipse. equir Profiler 


性 朋 分 析 : 匡 @Ocma| 上 局 由 在 | | 国信 上 | 
状态 : 性 能 分 析 处 于 不 活动 拒 态 
性 能 分 析 结 果 
国 下 全 落 | 四 te 加 固 | 
热点 - 方法 自用 - - - 
rni. transport. tcp. ICFIransport$Connectioniiandler rum | Es 
a util, eoncurrent ThresdpoolExecutorSWorjer run | Baa 
eclipse ui part ResourceIransfer getTypelds | 
nclipse swt Eraphics Inaee CEektImsEeDats ( 
erg eclipse jface viewers Structuredyicewer firePostSelectionChanced 
org. eclipse. jface. bindings. keys, fornatting,. JativeleyFormatter. ser tlledifis 
erg eclipse jface viewers StrocturedSeleection 《imit》 (jeva nl List) 


org, eclipse ui. editors text Te er Sep Db]) 
aclipse swt, eraphies, Devica isDisposaed 


时 
, 天 ] 


or et hashCode (bec 
org eclipse swt widgets Wident checkgidacet () 


嘱 (方法 名 过 泸 器 ] 


ow 
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图 4-15 对 应 用 程序 进行 CPU 执行 时 间 分 析 


注意 ”在 JDK 1.5 之 后 ， 在 Client 模 式 下 的 虚拟 机 加 入 并 且 自 动 开 启 
了 类 共享 一 一 这 是 一 个 在 多 虚拟 机 进程 中 共享 rt.jar 中 类 数据 以 提高 加 
载 速度 和 市 省 内 存 的 优化 ， 而 根据 相关 Bug 报 告 的 反映 ，VisualVM 的 
Profiler 功 能 可 能 会 因为 类 共享 而 导致 被 监视 的 应 用 程序 甬 误 ， 所 以 读 
者 进行 Profiling 前 ， 最 好 在 被 监视 程序 中 使 用 -Xshare:off 参 数 来 关闭 类 
共享 优化 。 


图 4-15 中 是 对 Eclipse IDE 一 段 操作 的 录制 和 分 析 结 霖 ， 读 者 分 析 目 
己 的 应 用 程序 时 ， 可 以 根据 实际 业务 的 复杂 程度 与 方法 的 时 间 、 调 用 


次 数 做 比较 ， 找 到 最 有 优化 价值 的 方法 。 
4.BTrace 动 态 日 志 跟 蹊 


BTracel | 是 一 个 很 “有 趣 ” 的 VisualVM 搬 件 ， 本 身 也 是 可 以 独立 运行 
的 程序 。 它 的 作用 是 在 不 停止 目标 程序 运行 的 前 提 下 ， 通 过 HotSpot 虚 
拟 机 的 HotSwap 技 术 于 动态 加 入 原本 并 不 存在 的 调试 代码 。 这 项 功能 对 
实际 生产 中 的 程序 很 有 意义 : 经 党 遇 到 程序 出 现 问题 ， 但 排查 错误 的 
一 些 必要 信息 ， 足 如 方法 参数 、 返 回 值 等 ， 在 开发 时 并 没有 打印 到 日 
志 之 中 ， 以 至 于 不 得 不 停 掉 服务 ， 通 过 调试 增 量 来 加 入 日 志 代码 以 解 
决 问题 。 当 遇 到 生产 环境 服务 无 法 随便 俘 止 时 ， 缺 一 两 句 日 志 导 致 排 
间 进 行 不 下 去 是 一 件 非常 郁 闽 的 事情 。 


在 VisualVM 中 安装 了 BTrace 插 件 后 ， 在 应 用 程序 面板 中 右键 点 击 
要 调试 的 程序 ， 会 出 现 "Trace Application..…..." 菜 单 ， 点 击 将 进入 
BTrace 面 板 。 这 个 面板 里 面 看 起 来 束 像 一 个 简单 的 Java 程 序 开发 环境 ， 
里 面 还 有 一 小 段 Java 代 码 ， 如 图 4-16 所 示 。 


攻 Java Visual\yl 


[文件 中 ) 应 用 程序 A) 视图 W) 工具 0) 窗口 W) 帮助 00) 
:如 国名 镜 曾 个 


: 出 爽 咏 让 | 起 术 页 8| 各 ore eclipse equinor launcher Wain (pid 3312) 其 | 们 | TisualW 其 
日 鸯 | 本 地 

日 -| 和 Wisealm 

[hespdum] 10.| ~ org. eclipse. equinox. launcher. Main (pid 3312) 


一 奢 Blrace Output Cass-Path 
客运 和 请 0pen .. 园 sw。 ks. . 邓 Stert 国 Step fF Evant 
忌 决 距 
1 /* Blrace Script Tenplate »/ 
inport con. sun,btrace. arnotations. +; 


inport static com. sun.btrace.BIraceUtils.*; 


@PIrace 
public class Tracing5cript 1{ 
As put your code here "| 


} 


图 4-16 BTrace 动 态 跟 路 


笔者 准备 了 一 段 很 简单 的 Java 代 码 来 演示 BTrace 的 功能 : 产生 两 个 
1000 以 内 的 随机 整数 ， 输 出 这 两 个 数字 相 加 的 结果 ， 如 代码 清单 4-11 所 


太 5 
代码 清单 4-11 BTrace 跟 踪 演 示 


public class BTraceTestt{ 
public int add (int a,int b) { 
return a+b; 


public static void main (String[]args) throws IOException{ 
BTraceTest test=new BTraceTest(); 


BufferedReader reader=new BufferedReader (new InputStreamReader 
(System.in) ) ; 

for (int i=0; i<10; i++) { 

reader ,readLine( ); 

int a= (int) Math.round (Math.random()*1000) ; 

int b= (int) Math.round (Math.random()*1000) ; 

System.out.println (test.add (a,b) ); 

} 

} 

} 


程序 运行 后 ， 在 VisualVM 中 打开 该 程序 的 监视 ， 在 BTrace 页 签 填 
充 TracingScript 的 内 容 ， 输 入 的 调试 代码 如 代码 清单 4-12 所 示 。 


代码 清单 4-12 ”BTrace 调 试 代码 


/*BTrace Script Template*/ 

import com.sun.btrace.annotations.*; 

import static com.sun.btrace.BTraceUtils.*; 

Q@BTrace 

public class TracingScript{ 

@onMethod ( 

clazz="org.fenixsoft.monitoring.BTraceTest", 

method="add", 

location=@Location (Kind .RETURN) 

) 

public static void func (@Self 
org.fenixsoft.monitoring.BTraceTest instance,int a,int b, @Return 
int result) { 

println ("调用 堆栈 :") ; 

jstack( ); 

println (strcat ("方法 参数 A:", str (a) ) ) ; 

println (strcat ("方法 参数 B:",，str (b) ) ) ; 

println (strcat ("方法 结果 :", str (result) ) ) ; 

} 

} 


点 击 "Start" 按 钮 后 稍 等 片刻 ， 编 译 完成 后 ， 可 见 Output 面 板 中 出 


ss 


现 "BTrace code successfuly deployed" 的 字样 。 程 序 运 行 的 了 时候 在 Output 


面板 将 会 输出 如 图 4-17 所 示 的 调试 信息 。 


起 始 页 中 和 org. fenixsoft. monitering. BIracelest (pid 4952) 路 
区 | 习 线 各 hn 


| VisuslVy 
让 org. fenixsoft. monitori A 
J org. fenixsoft. monitoring.BTraceTest (pid 4852) 


让 org, eclipse. equinox. 14 
让 org. eclipse. equinox. 1¢ [加 0utput 四 Class-Path | 


-营运 程 
“议决 照 


public static void func (@Self org.fenixsoft.nmonitoring.BIracelest instanc 


pzintln( 调用 扒 栈 : ) ; 

jstack(); 

printlnl(strcat ("方法 佑 数 A;", str (a))) | 
println(strcat ( 方法 窒 数 B:“, str(b))); 


println(strcat ( 力 法 结果 :", str (result))); 
a 


调用 堆 械 : 


org. fenixsoft. moni toring Blracelest. main (BIracelest. java:20) 
Lo ~ 


图 4-17 BTrace 跟 踪 结 


SN 


BTrace 的 用 法 还 有 许多 ， 打 印 调用 堆栈 、 参 数 、 返 回 值 只 是 最 基 


本 的 应 用 ， 在 它 的 网 站 上 有 使 用 BTrace 进 行 性 能 监视 、 定 位 连接 泄漏 
和 内 存 泄漏 、 解 决 多 线程 竞争 问题 等 例 于 ， 有 兴趣 的 读 着 可 以 去 相关 


网 站 了 解 一 下 。 


[1] 早 于 JDK1.6 的 平台 ， 需 要 打开 -Dcom.sun.management.jmxremote 参 数 
才能 被 VisualVM 管 理 。 

[2] 插 件 中 心地 址 : http://Visualvm java.net/pluginscenters.html 。 

[3] 官 方 主页 : http://kenai.com/projects/btrace/。 

[4]HotSwap 技 术 : 代码 热 蔡 换 技 术 ，HotSpot 虚 拟 机 允许 在 不 停止 运行 
的 情况 下 ， 更 新 已 经 加 载 的 类 的 代码 。 


4.4 ”本章 小 结 


本 章 介绍 了 随 JDK 发 布 的 6 个 命令 行 工 具 及 两 个 可 视 化 的 故障 处 理 
工具 ， 灵 活 使 用 这 些 工 具 可 以 给 问题 处 理 市 来 很 大 的 便利 。 


除了 JDK 自 带 的 工具 之 外 ， 常 用 的 故障 处 理工 具 还 有 很 多 ， 如 果 
读者 使 用 的 是 非 Sun 系 列 的 JDK、 非 HotSpot 的 虚拟 机 ， 束 需要 使 用 对 
应 的 工具 进行 分 析 ， 如 : 


IBM 的 Support Assistantl'] 、Heap Analyzer! ”| 、Javacore 
Analyzer 1 、Garbage Collector Analyzerl 适 用 于 IBM J9VM。 


HP 的 HPjmeterl”、HPjtune 适 用 于 HP-UX、SAP、HotSpot VM 。 


Eclipse 的 Memory Analyzer Tooll* (MAT) 适用 于 HP-UX、SAP、 


HotSpot VM， 安 装 IBM DTFJ 揪 件 后 可 支持 IBM J9 VM 。 
BEA 的 JRockit Mission Controll | 适用 于 JRockit VM 。 


[1 lhttp:/www.alphaworks.ibm.com/tech/heapanalyzer/download ° 
[21http:/www.alphaworks.ibm.com/tech/jca/download ° 


[3]http:/www.alphaworks.ibm.com/tech/pmat/download ° 


[41lhttps://h20392.www2.hp.com/portal/swdepot/displayProductInfo.do? 
productNumber=HPJMETER ° 

[51http:/www.eclipse.org/mat/ ° 
[6lhttp:/www.ibm.com/developerworks/java/jdk/tools/dtfj.html ° 
[7lhttp://download.oracle.com/docs/cd/E13150_01/jrockit_jvm/jrockit/tools 


/index.html ° 


第 5 章 ” 调 优 和 案例 分 析 与 实战 


Java 与 C++ 之 间 有 一 堵 由 内 存 动态 分 配 和 垃圾 收集 技术 所 围 成 
的 “高 墙 "， 墙 外 面 的 人 想 进 去 ， 墙 里 面 的 人 却 想 出 来 。 


5.1 概述 


上 文 介绍 了 处 理 Java 虚 拟 机 内 存 问 题 的 知识 与 工具 ， 在 处 理 实际 
项 目的 问题 时 ， 除 了 知识 与 工具 外 ， 经 验 同 样 是 一 个 很 重要 的 因素 。 
因此 本 章 将 与 读者 分 吾 儿 个 比较 有 代表 性 的 实际 和 案例。 考虑 到 虚拟 机 
故障 处 理 和 调 优 主要 面 癌 各 类 服务 端 应 用 ， 而 大 部 分 Java 程 序 员 较 少 
有 机 会 直接 接触 生产 环境 的 服务 器 ， 因 此 本 章 还 准备 了 一 个 所 有 开发 
人 员 痢 能 够 进行 “ 杀 映 实战 "的 练习 ， 项 望 通过 实践 使 读者 获得 故障 处 
理 和 调 优 的 经 验 。 


5.2 ”案例 分 析 


本 革 中 的 案例 大 部 分 来 源 于 笔者 处 理 过 的 一 些 问题 ， 还 有 一 小 部 
分 来 源 于 网 络 上 比较 有 特色 和 代表 性 的 案例 总 结 。 出 于 对 客户 商业 信 
恩 保 护 的 目的 ， 在 不 影响 前 后 人 逻辑 的 前 提 下 ， 笔 者 对 实际 环境 和 用 户 
业务 做 了 一 些 屏 蔽 和 精简 。 


5.2.1 噩 性 能 人 硬件 上 的 程序 部 车 策 略 


例如 ， 一 个 15 万 PV/ 天 左右 的 在 线 文档 类 型 网 站 最 近 更 换 了 硬件 
系统 ， 新 的 人 硬件 为 4 个 CPPU、16GB 物 理 内 存 ， 操 作 系 统 为 64 位 CentOS 
5.4，Resin 作 为 Web 服 务 器 。 整 个 服务 器 暂时 没有 部 署 别 的 应 用 ， 所 有 
硬件 资源 都 可 以 提供 给 这 访问 量 并 不 算 太 大 的 网 站 使 用 。 管 理 员 为 了 
尽量 利用 硬件 资源 选用 了 64 位 的 JDK 1.5， 并 通过 -Xmx 和 -Xms 参 数 将 
Java 堆 固定 在 12GB。 使 用 一 段 时 间 后 发 现 使 用 效果 并 不 理想 ， 网 站 经 
常 不 定期 出 现 长 时 间 失 去 响应 的 情况 。 


监控 服务 器 运行 状况 后 发 现 网 站 失去 啊 应 是 由 GC 集 顿 导 怪 的 ， 虚 
拟 机 运行 在 Server 模 式 ， 黑 认 使 用 吞吐 量 优 移 收集 右 ， 回 收 12GB 的 
堆 ， 一 次 Full GC 的 停顿 时 间 高 达 14 秒 。 并 且 由 于 程序 设计 的 关系 ， 访 
问 文档 时 要 把 文档 从 磁盘 提取 到 内 存 中 ， 导 致 内 存 中 出 现 很 多 由 文档 


序列 化 产生 的 大 对 象 ， 这 些 大 对 和 象 很 多 都 进入 了 老年 代 ， 没 有 在 Minor 
GC 中 清理 掉 。 这 种 情况 下 即使 有 12GB 的 堆 ， 内 存 也 很 快 被 消耗 殉 
尽 ， 由 此 导致 每 隔 十 几 分 钟 出 现 十 几 秘 的 俘 顿 ， 令 网 站 开发 人 员 和 管 
理 员 感 到 很 诅 形 。 


这 里 移 不 延伸 讨论 程序 代码 问题 ， 程 序 部 署 上 的 主要 问题 显然 是 
过 大 的 推 内 存 进行 回收 时 带 来 的 长 时 间 的 停顿 。 硬 件 升 级 前 使 用 32 位 
系统 1.5GB 的 堆 ， 用 户 只 感觉 到 使 用 网 站 比较 缓慢 ， 但 不 会 发 生 十 分 
明显 的 停顿 ， 因 此 才 考虑 升级 硬件 以 提升 程序 效能 ， 如 有 果 重 新 缩小 给 
Java 推 分配 的 内 存 ， 那 么 硬件 上 的 投资 吏 显 得 很 良 费 。 


在 高 性 能 硬件 上 部 署 程序 ， 目 前 主要 有 两 种 方式 : 
通过 64 位 JDK 来 使 用 大 内 存 。 
使 用 若干 个 32 位 虚拟 机 建立 逻辑 集群 来 利用 硬件 资源 。 


此 案例 中 的 管理 员 采 用 了 第 一 种 部 署 方式 。 对 于 用 户 交 互 性 强 、 
对 停顿 时 间 敏 感 的 系统 ， 可 以 给 Java 虚 拟 机 分 配 超大 堆 的 前 提 是 有 把 
握 把 应 用 程序 的 Full GC 频率 控制 得 足够 低 ， 至 少 要 低 到 不 会 影响 用 户 
使 用 ， 壁 如 十 几 个 小 时 力 至 一 天 才 出 现 一 次 Ful GC， 这 样 可 以 通过 在 
深夜 执行 定时 任务 的 方式 触发 Full GC 甚至 自动 重启 应 用 服务 器 来 保持 
内 存 可 用 空间 在 一 个 稳定 的 水 平 。 


控制 Full GC 频率 的 关键 是 看 应 用 中 绝 大 多 数 对 象 能 否 符 合 “ 朝 生 
夕 火 ”的 原则 ， 即 大 多 数 对 象 的 生存 时 间 不 应 太 长 ， 尤 其 是 不 能 有 成 批 
量 的 、 长 生存 时 间 的 大 对 象 产 生 ， 这 样 才 能 你 障 老年 代 空间 的 稳定 。 


在 大 多 数 网 站 形式 的 应 用 里 ， 主 要 对 象 的 生存 周期 都 应 该 是 请 求 
级 或 者 页 面 级 的 ， 会 话 级 和 全 局 级 的 长 生命 对 象 相对 很 少 。 只 要 代码 
写 得 合理 ， 应 当 都 能 实现 在 超大 堆 中 正常 使 用 而 没有 Full GC， 这 样 的 
话 ， 使 用 超大 堆 内 存 时 ， 网 站 啊 应 速度 才 会 比较 有 保证 。 除 此 之 外 ， 
如 果 读 者 计划 使 用 64 位 JDK 来 管理 大 内 存 ， 还 需要 考虑 下 面 可 能 面临 


的 问题 |: 


内 存 回 收 导 致 的 长 时 间 集 顿 。 


现 阶 段 ，64 位 JDK 的 性 能 测试 结果 普遍 低 于 32 位 JDK。 


需要 保证 程序 足够 稳定 ， 因 为 这 种 应 用 要 是 产生 堆 洲 出 几乎 束 无 
法 产生 堆 转 储 快照 (因为 要 产生 十 儿 GB 力 至 更 大 的 Dump 文 件 ， ， 哪 
怕 产 生 了 快照 也 几乎 无 法 进行 分 析 。 


相同 程序 在 64 位 JDK 消 耗 的 内 存 一 般 比 32 位 JDK 大 ， 这 是 由 于 指 
针 脱 胀 ， 以 及 数据 类 型 对 齐 补 白 等 因素 导致 的 。 


上 面 的 问题 听 起 来 有 点 吓人 ， 所 以 现 阶段 不 少 管理 员 还 是 选择 第 
二 种 方式 : 使 用 硅 干 个 32 位 虚拟 机 建立 逻辑 集群 来 利用 硬件 资源 。 具 


体 做 法 是 在 一 台 物 理 机 右上 局 动 多 个 应 用 服务 右 进 程 ， 每 个 服务 器 进 
程 分 配 不 同 端口 ， 然 后 在 前 器 搭建 一 个 负载 均衡 器 ， 以 反问 代 理 的 方 
式 来 分 配 访问 请 求 。 谈 者 不 需要 太 过 在 意 均衡 锅 转 发 所 消耗 的 性 能 ， 
即使 使 用 64 位 JDK， 许 多 应 用 也 不 止 有 一 台 服 务 器 ， 因 此 在 许多 应 用 
中 前 端的 均衡 磊 总 是 要 存在 的 。 


考虑 到 在 一 合 物理 机 万 上 建立 逻 错 集群 的 目的 仅仅 是 为 了 尽 可 能 
利用 硬件 资产 ， 并 不 需要 关心 状态 保留 、 热 转移 之 类 的 高 可 用 性 需 
求 ， 也 不 需要 保证 每 个 虚拟 机 进程 有 绝对 准确 的 均衡 负载 ， 因 此 使 用 
无 Session 复 制 的 亲 合 式 集 群 是 一 个 相当 不 错 的 选择 。 我 们 仅仅 需要 保 
障 集群 具备 亲 合 性 ， 也 就 是 均衡 器 按 一 定 的 规则 算法 (一 般 根据 
SessionID 分 配 ) 将 一 个 固定 的 用 户 请 求 永 远 分 配 到 固定 的 一 个 集群 
扩 进 行 处 理 即 可 ， 这 样 程序 开 发 阶段 号 基本 不 用 为 集群 环境 做 什么 特 
别 的 考虑 了 。 


当然 ， 很 少 有 没有 缺点 的 方案 ， 如 采 读 者 计划 使 用 逻辑 集群 的 方 
式 来 部 车 程序 ， 可 能 会 遇 到 下 面 一 些 问 题 : 


尽量 避免 市 点 苋 争 全 局 的 资源 ， 最 典型 的 束 古 磁 副 芝 争 ， 各 个 广 
点 如 果 同 时 访问 某 个 磁盘 文件 的 话 (尤其 是 并 发 写 操作 容易 出 现 问 


题 ) ， 很 容易 导致 IO 异常 。 


很 难 最 高 效率 地 利用 某 些 资源 池 ， 壁 如 连接 池 ， 一 般 都 是 在 各 个 
节 扩 建立 目 己 独立 的 连接 池 ， 这 样 有 可 能 导致 一 些 市 点 池 满 了 而 男 外 
一 些 节 点 仍 有 较 多 空余 。 尽 管 可 以 使 用 集中 式 的 JNDI， 但 这 个 有 一 定 
复杂 性 并 且 可 能 市 来 额外 的 性 能 开销 。 


各 个 节点 仍然 不 可 避免 地 受到 32 位 的 内 存 限制 ， 在 32 位 Windows 
平台 中 每 个 进程 只 能 使 用 2GB 的 内 存 ， 考 虑 到 堆 以 外 的 内 存 开销 ， 堆 
一 般 最 多 只 能 开 到 1.5GB。 在 某 些 Linux 或 UNIX 系 统 (如 Solaris) 中 ， 
可 以 提升 到 3GB 疙 至 接近 4GB 的 内 存 ， 但 32 位 中 仍然 受 最 高 4GB 
4232) 内 存 的 限制 。 


大 量 使 用 本 地 缓存 〈 如 大 量 使 用 HashMap 作 为 K/V 缓 存 ) 的 应 
用 ， 在 逻辑 集群 中 会 造成 较 大 的 内 存 银 费 ， 因 为 每 个 逻辑 节点 上 都 有 
一 份 缓存 ， 这 时 候 可 以 考虑 把 本 地 缓存 改 为 集中 式 缓 存 。 


介绍 完 这 两 种 部 署 方式 ， 再 重新 问 到 这 个 案例 之 中 ， 最 后 的 部 署 
方案 调整 为 建立 5 个 32 位 JDK 的 逻辑 集群 ， 每 个 进程 按 2GB 内 存 计 算 
(其 中 堆 固定 为 1.5GB) ， 占 用 了 10GB 内 存 。 另 外 建立 一 个 Apache 服 
务 作 为 前 端 均衡 代理 访问 门户 。 考 虑 到 用 户 对 响应 速度 比较 关心 ， 并 
且 文 档 服务 的 主要 压力 集中 在 磁盘 和 内 存 访 问 ，CPU 资 源 敏 感度 较 
低 ， 因 此 改 为 CMS 收集 器 进行 垃圾 回收 。 部 署 方式 调整 后 ， 服 务 再 没 
有 出 现 长 时 间 人 停顿， 速度 比 硬件 升级 前 有 较 大 提升 。 


5.2.2 ”集群 间 同 步 导 致 的 内 存 洲 出 


例如 ， 有 一 个 基于 B/S 的 MIS 系 统 ， 硬 件 为 两 台 2 个 CPU、8GB 内 存 
的 HP 小 型 机 ， 服 务 器 是 WebLogic 9.2， 每 台 机 器 启动 了 3 个 WebLogic 实 
例 ， 构 成 一 个 6 个 节点 的 亲 合 式 集群 。 由 于 是 亲 合 式 集群 ， 节 点 之 间 没 
有 进行 Session 同 步 ， 但 是 有 一 些 需求 要 实现 部 分 数据 在 各 个 节点 间 共 
享 。 开 始 这 些 数据 存放 在 数据 库 中 ， 但 由 于 读 写 频繁 竞争 很 激烈 ， 性 
能 影响 较 大 ， 后 面 使 用 JBossCache 构 建 了 一 个 全 局 缓存 。 全 局 缓存 启用 
后 ， 服 务 正 常 使 用 了 一 段 较 长 的 时 间 ， 但 最 近 却 不 定期 地 出 现 了 多 次 
的 内 存 溢出 问题 。 


在 内 存 海 出 异 音 不 出 现 的 时 候 ， 服 务 内 存 回 收 状况 一 直 正 靖 ， 
次 内 存 回收 后 都 能 恢复 到 一 个 稳定 的 可 用 空间 ， 开 始 怀疑 是 程序 某 些 
不 常用 的 代码 路 径 中 存在 内 存 泄漏 ， 但 管理 员 反 映 最 近 程 序 并 未 更 
新 、 升 级 过 ， 也 没有 进行 什么 特别 操作 。 只 好 让 服务 带 着 - 
XX:+HeapDumpOnOutOfMemoryError 参 数 运行 了 一 段 时 间 。 在 最 近 一 
次 淤 出 之 后 ， 管 理 员 发 回 了 heapdump 文 件 ， 发 现 里 面 存 在 着 大 量 的 
org.jgroups.protocols.pbcast.NAKACK 对 和 象 。 


JBossCache 是 基于 目 家 的 JGroups 进 行 集群 则 的 数据 通信 ，JGroups 
使 用 协议 栈 的 方式 来 实现 收发 数据 包 的 各 种 所 需 特 性 自由 组 合 ， 数 据 
包 接 收 和 发 送 时 要 经 过 每 层 协议 栈 的 up0 和 down() 方 法 ， 其 中 的 


NAKACK 栈 用 于 保障 各 个 包 的 有 效 顺 序 及 重 发 。JBossCache 协 议 栈 如 
图 5-1 所 示 。 


-| 中 Daemon Thread [Downlandler (VTEW_SYHC)] {Suspended (breakpoint at line 401 in NAKACK)) 
NAKACK, down {Event) line. 401 

NAKACK (Protocol). receivelownEvent (Event) line: S17 
UNICAST (Frotocol). passDown Event) line: 551 
UNICAST. down (Event) line: 355 

UNICAST (Frotocol). receivelownEvent (Event) line: S17 
STABLE (Frotocol). passlown (Event) line: 551 

STABLE, down {Event) line; 283 

STABLE (Frotocol). receiveDownEvent (Event) line: S17 
FRAG (Protocol). passDown (Event) line: 551 

FRAG. down (Event) line: 139 

FRAG (Protocol). receivelownEvent (Event) line: 517 
VIEW_SYNC (Frotocol). passlowr (Event) line: 551 
VIEW_SYNC. down (Event) line: 166 

DownHandler. runl) line: 121 


图 5-1 JBossCache 协 议 栈 


由 于 信息 有 传输 失败 需要 重 发 的 可 能 性 ， 在 确认 所 有 注册 在 GMS 
J Membership Service) 的 节点 都 收 到 正确 的 信息 前 ， 发 送 的 信 
恩 必 须 在 内 存 中 保留 。 而 此 MIS 的 服务 端 中 有 一 个 负责 安全 校 验 的 全 局 
Filter， 每 当 接 收 到 请 求 时 ， 均 会 更 新 一 次 最 后 操作 时 间 ， 并 且 将 这 
时 间 同 步 到 所 有 的 节点 去 ， 使 得 一 个 用 户 在 一 段 时 间 内 不 能 在 多 人 台 机 
苍 上 有 登 示 。 在 服务 使 用 过 程 中 ， 往 往 一 个 页 面 会 产生 数 识 乃至 效 十 次 
的 请 求 ， 因 此 这 个 过 滤 夯 导致 集群 各 个 下 点 之 间 网 络 交 互 非常 频 驼 。 

当 网 络 情况 不 能 满足 传输 要 求 时 ， 重 发 数据 在 内 存 中 不 断 堆 积 ， 很 快 
束 产 生 了 内 存 洲 出 。 


这 个 案例 中 的 问题 ， 既 有 JBossCache 的 缺陷 ， 也 有 MIS 系 统 实现 方 
式 上 缺陷 。JBossCache 官 方 的 maillist 中 讨论 过 很 多 次 类 似 的 内 存 溢出 异 
常 问题， 据说 后 续 版 本 也 有 了 改进 。 而 更 重要 的 缺陷 是 这 一 类 被 集 群 
共享 的 数据 要 使 用 类 似 JBossCache 这 种 集群 缓存 来 同步 的 话 ， 可 以 允许 
操作 频 烷 ， 因 为 数据 在 本 地 内 存 有 一 份 副 本 ， 读 取 的 动作 不 会 耗费 
少 质 产 ， 但 不 应 当 有 过 于 频 索 的 写 操作 ， 那 样 会 市 来 很 大 的 网 络 同 
的 开销 。 


唱 民 汪 > 


5.2.3” 堆 外 内 存 导致 的 次 出 销 误 


例如 ， 一 个 学 校 的 小 型 项 目 ， 基 于 B/S 的 电子 考试 系统 ， 为 了 实现 
客户 端 能 实时 地 从 服务 器 端 接收 考试 数据 ， 系 统 使 用 了 逆向 AJAX 技 
术 (也 称 为 Comet 或 者 Server Side Push) ， 选 用 CometD 1.1.1 作 为 服务 
端 推送 框架 ， 服 务 器 是 Jetty 7.1.4， 硬 件 为 一 台 普 通 PC 机 ，Core i5 


CPU，4GB 内 存 ， 运 行 32 位 Windows 操 作 系 统 。 


测试 期 间 发 现 服 务 端 不 定时 抛 出 内 存 溢出 异常 ， 服 务 器 不 一 定 每 
次 都 会 出 现 异 常 ， 但 假如 正式 考试 时 崩溃 一 次 ， 那 估计 整 场 电 子 考试 
都 会 乱 套 ， 网 站 管理 员 尝试 过 把 堆 开 到 最 大 ， 而 32 位 系统 最 多 到 
1.6GB 束 基本 无 法 再 加 大 了 ， 而 且 开 大 了 基本 没 效果 ， 抛 出 内 存 淤 出 
异常 好 像 还 更 加 频繁 了 。 加 入 - 
XX:+HeapDumpOnOutOfMemoryError， 居 然 也 没有 任何 反应 ， 抛 出 内 
存 洲 出 异常 时 什么 文件 都 没有 产生 。 无 奈 之 下 只 好 挂 着 jstat 并 一 直 紧 
采 屏 幕 ， 发 现 GC 并 不 频繁 ，Eden 区 、Survivor 区 、 老 年 代 以 及 永久 代 
内 存 全 部 都 表示 “情绪 稳定 ， 压 力 不 大 ”， 但 束 是 照样 不 停 地 抛 出 内 存 
溢出 异常 ， 管 理 员 压 力 很 大 。 最 后 ， 在 内 存 洲 出 后 从 系统 日 志 中 找到 
异常 堆栈 ， 如 代码 清单 5-1 所 示 。 


代码 清单 5-1 异常 堆栈 


[org.eclipse.jetty.util.1loglhandle failed 
java.lang.OutofMemoryError:null 

at sun.misc.Unsafe.allocateMemory (Native Method) 

at java.nio.DirectByteBuffer.<init> (DirectByteBuffer.java:99) 

at java.nio.ByteBuffer.allocateDirect (ByteBuffer.java:288) 

at org.eclipse.jetty.io.nio.DirectNIOBuffer.<init> 


如 果 认 真 阅 读 过 本 书 的 第 2 章 ， 看 到 异常 堆栈 就 应 该 清楚 这 个 抛 出 
内 存 次 出 异常 是 怎么 回 事 了 。 大 家 知道 操作 系统 对 每 个 进程 能 管理 的 
内 存 是 有 限制 的 ， 这 人 台 服 务 器 使 用 的 32 位 Windows 平 台 的 限制 是 
2GB， 其 中 划 了 1.6GB 给 Java 堆 ， 而 Direct Memory 内 存 并 不 算 入 1.6GB 
的 堆 之 内 ， 因 此 它 最 大 也 只 能 在 剩余 的 0.4GB 空 间 中 分 出 一 部 分 。 在 
此 应 用 中 导致 溢出 的 关键 是 : 垃圾 收集 进行 时 ， 虚 拟 机 虽然 会 对 Direct 
Memory 进 行 回收 ， 但 是 Direct Memory 却 不 能 像 新 生 代 、 老 年 代 那 
样 ， 发 现 空间 不 足 了 就 通知 收集 器 进行 垃圾 回收 ， 它 只 能 等 待 老年 代 
满 了 后 Full GC， 然 后 顺便 地 ” 帮 它 清理 掉 内 存 的 废弃 对 象 。 否 则 它 只 
能 一 直 等 到 抛 出 内 存 淤 出 异常 时 ， 先 catch 掉 ， 再 在 catch 块 里 面 “大 
喊 ” 一 声 : "System.gc0O!1"。 要 是 虚拟 机 还 是 不 听 ( 壁 如 打开 了 - 
XX:+DisableExplicitGC 开 关 ) ， 那 承 只 能 眼睁睁 地 看 着 堆 中 还 有 许多 
空 亲 内存， 自己 却 不 得 不 抛 出 内 存 汶 出 异常 了 。 而 本 案例 中 使 用 的 
CometD 1.1.1 框 架 ， 正 好 有 大 量 的 NIO 操 作 需 要 使 用 到 Direct Memory 
内 存 。 


从 实践 经 验 的 角度 出 发 ， 除 了 Java 堆 和 永久 代 之 外 ， 我 们 注意 到 
下 面 这 些 区 域 还 会 占用 较 多 的 内 存 ， 这 里 所 有 的 内 存 总 和 受到 操作 系 


统 进程 最 大 内 存 的 限制 。 


Direct Memory: 可 通过 -XX:MaxDirectMemorySize 调 整 大 小 ， 内 
存 不 足 时 抛 出 OutOfMemoryError 或 者 OutOfMemoryError:Direct buffer 


memory。 


线程 堆栈 : 可 通过 -Xss 调 整 大 小 ， 内 存 不 足 时 抛 出 
StackOverflowError 〈 纵 向 无 法 分 配 ， 即 无 法 分 配 新 的 栈 帧 ) 或 者 
OutOfMemoryError:unable to create new native thread ( 横 癌 无 法 分 配 ， 


即 无 法 建立 新 的 线程 ) 。 


Socket 缓 存 区 : 每 个 Socket 连 接 都 Receive 和 Send 两 个 缓存 区 ， 分 
别 占 大 约 37KB 和 25KB 内 存 ， 连 接 多 的 话 这 块 内 存 占用 也 比较 可 观 。 
如 果 无 法 分 配 ， 则 可 能 会 抛 出 IOException:Too many open files 异 常 。 


JNI 代 码 : 如 果 代 码 中 使 用 JNI 调 用 本 地 库 ， 那 本 地 库 使 用 的 内 存 
也 不 在 堆 中 。 


虚拟 机 和 GC: 虚拟 机 、GC 的 代码 执行 也 要 消耗 一 定 的 内 存 。 


5.2.4 ”外 部 命令 导致 系统 缓慢 


这 是 一 个 来 目 网 络 的 案例 : 一 个 数字 校园 应 用 系统 ， 运 行 在 一 台 4 
个 CPU 的 Solaris 10 棵 作 系 统 上 ， 中 间 件 为 GlassFish 服 务 器 。 系 统 在 做 
大 并 发 压力 测试 的 时 候 ， 发 现 请 求 响应 时 间 比 较 慢 ， 通 过 操作 系统 的 
mpstat 工 具 发 现 CPU 使 用 率 很 高 ， 并 且 系 统 占用 绝 大 多 数 的 CPU 资源 
的 程序 并 不 是 应 用 系统 本 身 。 这 是 个 不 正常 的 现象 ， 通 常情 况 下 用 户 
应 用 的 CPU 占用 率 应 该 占 主 要 地 位 ， 才 能 说 明 系 统 是 正常 工作 的 。 


通过 Solaris 10 的 Dtrace 脚 本 可 以 查看 当前 情况 下 哪些 系统 调用 人 花 
费 了 最 多 的 CPU 资源 ，Dtrace 运 行 后 发 现 最 消耗 CPU 资源 的 竟然 
是 "fork" 系 统 调用 。 众 所 周知 ，"fork" 系 统 调用 是 Linux 用 来 产生 新 进程 
的 ， 在 Java 虚 拟 机 中 ， 用 户 编写 的 Java 代 码 最 多 只 有 线程 的 概念 ， 不 
应 当 有 进程 的 产生 。 


这 是 个 非常 异常 的 现象 。 通 过 本 系统 的 开发 人 员 ， 最 终 找到 了 管 
案 : 每 个 用 户 请 求 的 处 理 都 需要 执行 一 个 外 部 shell 脚 本 来 获得 系统 的 
一 些 信息 。 执 行 这 个 shell 脚 本 是 通过 Java 的 Runtime.getRuntime().exec() 
方法 来 调用 的 。 这 种 调用 方式 可 以 达到 目的 ， 但 是 它 在 Java 虚 拟 机 中 
是 非常 消耗 资源 的 操作 ， 即 使 外 部 命令 本 身 能 很 快 执 行 完 毕 ， 频 繁 调 
用 时 创建 进程 的 开销 也 非常 可 观 。Java 虚 拟 机 执行 这 个 命令 的 过 程 


征 : 首先 克隆 一 个 和 当前 虚拟 机 拥有 一 样 环境 变量 的 进程 ， 再 用 这 个 
新 的 进程 去 执行 外 部 命令 ， 最 后 再 退出 这 个 进程 。 如 琳 频 或 执行 这 个 
操作 ， 系 统 的 请 耗 会 很 天， 不仅 是 CPU， 内 存 负担 也 很 重 。 


用 户 根据 建议 去 掉 这 个 Shell 脚 本 执行 的 语句 ， 改 为 使 用 Java 的 API 
去 获取 这 些 信 息 后 ， 系 统 很 快 恢复 了 正常 。 


5.2.5 服务 器 JVM 进 程 般 演 


例如 ， 一 个 基于 B/S 的 MIS 系 统 ， 硬 件 为 两 台 2 个 CPU、8GB 内 存 

的 HP 系统 ， 服 务 Ni (就 是 5.2.2 节 中 的 那 套 系统 ) 。 正 

常 运 行 一 段 时 间 后 ， 最 近 发 现在 运行 期 间 频繁 出 现 集群 节点 的 虚拟 机 

进程 目 动 关闭 的 现象 ， 留 下 了 一 个 hs_err_pid###.log 文 件 后 ， 进 程 束 消 

失 了 ， 两 台 物 理 机 器 里 的 每 个 节点 都 出 现 过 进程 甬 溃 的 现象 。 从 系统 

日 志 中 可 以 看 出 ， 每 个 节点 的 虚拟 机 进程 在 月 演 前 不 久 ， 都 发 生 过 大 
量 相 同 的 异常 ， 见 代码 清单 5-2。 


代码 清单 5-2 ”异常 堆栈 2 


Java.net.SocketException:Connection reset 

at java.net.SocketInputStream.read (SocketInputStream.java:168) 

at java.io.BufferedIinputStream.fill 
(BufferedInputStream.java:218) 

at java.io.BufferedIinputStream.read 
(BufferedInputStream.java:235) 

at 

org.apache.axis.transport.http.HTTPSender .readHeadersFromSocket 

(HTTPSender .java:583) 

at org.apache.axis.transport.http.HTTPSender ,Invoke 
(HTTPSender .java:143) .….99 more 


这 是 一 个 远 端 断 开 连接 的 异常 ， 通 过 系统 管理 员 了 解 到 系统 最 近 
与 一 个 OA 门户 做 了 集成 ， 在 MIS 系 统 工作 流 的 竺 办 事项 变化 时 ， 要 通 
过 Web 服 务 通知 OA 门户 系统 ， 把 待 办 事项 的 变化 同步 到 OA 门户 之 


E 


通过 SoapUI 测 试 了 一 下 同步 待 办 事项 的 几 个 Web 服 务 ， 发 现 调用 
然 需 要 长 达 3 分 钟 才能 返回 ， 并 且 返 回 结果 都 是 连接 中 断 。 


由 于 MIS 系 统 的 用 户 多 ， 笨 办 事项 变化 很 快 ， 为 了 不 被 OA 系统 速 
度 拖 累 ， 使 用 了 有 异步 的 方式 调用 Web 服 务 ， 但 由 于 两 边 服务 速度 的 完 
全 不 对 等 ， 时 间 越 长 环球 积 了 越 多 Web 服 务 没有 调用 完成 ， 导 致 在 等 
竺 的 线程 和 Socket 和 连接 越 来 越 多 ， 最 终 在 超过 虚拟 机 的 承受 能 力 后 使 
得 虚拟 机 进程 衣 涡 。 解 决 方法 ， 通知 OA 门户 方 修复 无 法 使 用 的 集成 接 
口 ， 并 将 异步 调用 改 为 生产 者 /消费 者 模式 的 消 恩 队列 实现 后 ， 系 统 恢 
复 正常 。 


5.2.6 不 恰当 数据 结构 导致 内 存 占用 过 大 


例如 ， 有 一 个 后 人 台 RPC 服 务 右 ， 使 用 64 位 虚拟 机 ， 内 存 配置 为 - 
Xms4g-Xmx8g-Xmnlg， 使 用 ParNew+CMS 的 收集 器 组 合 。 平 时 对 外 服 
务 的 Minor GC 时 间 约 在 30 毫 秒 以 内 ， 完 全 可 以 接受 。 但 业务 上 需要 每 
分 钟 加 载 一 个 约 80MB 的 数据 文件 到 内 存 进行 数据 分 析 ， 这 些 数 据 
会 在 内 存 中 形成 超过 100 万 个 HashMap <Long,Long > Entry， 在 这 上 段 时 
间 里 面 Minor GC 就 会 造成 超过 500 毫 秒 的 停顿 ， 对 于 这 个 停顿 时 间 就 
接受 不 了 了 ， 具 体 情 况 如 下 面 GC 日 志 所 示 。 


{Heap before GC invocations=95 (full 4) : 

par new generation total 903168K,used 
803142K[0x00002aaaae770000，0x00002aaaebb70000，9x00002aaaebb70000) 

eden Space 802816K，100%used[0x00002aaaae770000， 
0x00002aaadf770000，0x00002aaadf770000) 

from space 100352K, OQ%used[O0x00002aaae5970000, 
Ox00002aaae59c1910,，0x00002aaaebb70000) 

to space 100352K，0%used[0x00002aaadf770000，0x00002aaadf770000， 
90x00002aaae5970000) 

concurrent mark-sweep generation total 5845540K, Used 
3898978K[0x00002aaaebb70000，0x00002aac507f9000， 
0x00002aacae770000) 

concurrent-mark-sweep perm gen total 65536K, Used 
40333K[0x00002aacae770000，0x00002aacb2770000，0x00002aacb2770000) 

2011-10-28 T11:40:45.162+0800:226.504:[GC226.504 
[ParNew:803142K- >100352K (903168K) ，0.5995670 secs]4702120K- > 
4056332K (6748708K) ，0.5997560 

secs][Times:user=1.46 sys=0.04, real=0.60 secs] 

Heap after GC invocations=96 (full 4) : 

par new generation total 903168K,used 
100352K[0x00002aaaae770000，0x00002aaaebb70000，9x00002aaaebb70000) 

eden Space 802816K，g0%used[0x00002aaaae770000， 
0x00002aaaae770000，0x00002aaadf770000) 


from space 100352K，100%used[0x00002aaadf770000， 
0O0X00002aaae5970000， 

0x00002aaae5970000) 

to space 100352K, Ox00002aaaebb70000) 9%used[0x00002aaae5970000， 
Ox00002aaae5970000, 

concurrent mark-sweep generation total 5845540K,used 
3955980K[0x00002aaaebb70000，0x00002aac507f9000， 
0x00002aacae770000) 

concurrent-mark-sweep perm gen total 65536K, Used 
40333K[0x00002aacae770000，0x00002aacb2770000， 90x00002aacb2770000) 

} 

Total time for which application threads were stopped:0.6070570 
seconds 


观察 这 个 案例 ， 发 现 平时 的 Minor GC 时 间 很 短 ， 原 因 是 新 生 代 的 
绝 大 部 分 对 象 都 是 可 清除 的 ， 在 Minor GC 之 后 Eden 和 Survivor 基 本 上 
处 于 完全 空闲 的 状态 。 而 在 分 析 数 据 文件 期 间 ，800MB 的 Eden 空 间 很 
快 被 填 满 从 而 引发 GC， 但 Minor GC 之 后 ， 新 生 代 中 绝 大 部 分 对 象 依然 
是 存活 的 。 我 们 知道 ParNew 收 集 器 使 用 的 是 复制 算法 ， 这 个 算法 的 高 
效 是 建立 在 大 部 分 对 象 都 “ 朝 生 夕 灭 ”的 特性 上 的 ， 如 果 存 活 对 象 过 
多 ， 把 这 些 对 象 复制 到 Survivor 并 维持 这 些 对 象 引用 的 正确 就 成 为 一 个 
沉重 的 负担 ， 因 此 导致 GC 暂停 时 间 明 显 变 长 。 


如 果 不 修改 程序 ， 仅 从 GC 调 优 的 角度 去 解决 这 个 问题 ， 可 以 考虑 
将 Survivor 空 间 去 掉 〈 加 入 参数 -XX:SurvivorRatio=65536、- 
XX:MaxTenuringThreshold=0 或 者 -XX:+AlwaysTenure) ， 让 新 生 代 中 
存活 的 对 象 在 第 一 次 Minor GC 后 立即 进入 老年 代 ， 等 到 Major GC 的 时 
候 再 清理 它们 。 这 种 措施 可 以 治标 ， 但 也 有 很 大 副作用 ， 治 本 的 方案 


需要 修改 程序 ， 因 为 这 里 的 问题 产生 的 根本 原因 是 用 HashMap < 
LongLong> 结 构 来 存储 数据 文件 空间 效率 太 低 。 


下 面具 体 分 析 一 下 空间 效率 。 在 HashMap <Long,Long> 结构 中 ， 

只 有 Key 和 Value 所 存放 的 两 个 长 整 型 数据 是 有 效 数 据 ， 共 16B 

(2x8B) 。 这 两 个 长 整 型 数据 包装 成 java.lang.Long 对 象 之 后 ， 就 分 别 
具有 8B 的 MarkWord、8B 的 Klass 指 针 ， 在 加 8B 存 储 数 据 的 long 值 。 在 
这 两 个 Long 对 象 组 成 Map.Entry 之 后 ， 又 多 了 16B 的 对 象 头 ， 然 后 一 个 
8B 的 next 字 段 和 4B 的 int 型 的 hash 字 段 ， 为 了 对 齐 ， 还 必须 添加 4B 的 空 
日 填充 ， 最 后 还 有 HashMap 中 对 这 个 Entry 的 8B 的 引用 ， 这 样 增加 两 个 
长 整 型 数字 ， 实 际 耗费 的 内 存 为 (Long (24B) x2) +Entry (32B) 
+HashMap Ref (8B) =88B， 空 间 效 率 为 16B/88B=18%， 实 在 太 低 
下 o 


5.2.7 ”由 Windows 虚 拟 内 存 导致 的 长 时 间 停 顿 [1] 


例如 ， 有 一 个 带 心 跳 检 测 功 能 的 GUI 桌 面 程 序 ， 每 15 秒 会 发 送 一 
次 心跳 检测 信和 号， 如 果 对 方 30 秒 以 内 都 没有 信号 返回 ， 那 就 认为 和 对 
方程 序 的 连接 已 经 断 开 。 程 序 上 线 后 发 现 心跳 检测 有 广 报 的 概率 ， 查 
询 日 志 发 现 误 报 的 原因 是 程序 会 偶尔 出 现 间 隔 约 一 分 钟 左右 的 时 间 完 
全 无 日 志 输 出 ， 处 于 停顿 状态 。 


因为 是 桌面 程序 ， 所 需 的 内 存 并 不 大 (-Xmx256m) ， 所 以 开始 
并 没有 想到 是 GC 导致 的 程序 停顿 ， 但 是 加 入 参数 - 
XX:+PrintGCApplicationStoppedTime-XX:+PrintGCDateStamps- 
Xloggc:gclog.log 后 ， 从 GC 日 志文 件 中 确认 了 停顿 确实 是 由 GC 导致 
的 ， 大 部 分 GC 时 间 都 控制 在 100 毫 秒 以 内 ， 但 偶尔 就 会 出 现 一 次 接近 
分 钟 的 GC 。 


Total time for which application threads were stopped:0.0112389 
seconds 

Total time for which application threads were stopped:0.0001335 
seconds 

Total time for which application threads were stopped:0.0003246 
seconds 

Total time for which application threads were stopped:41.4731411 
seconds 

Total time for which application threads were stopped:0.0489481 
seconds 

Total time for which application threads were stopped:0.1110761 
seconds 

Total time for which application threads were stopped:0.0007286 
seconds 


Total time for which application threads were stopped:0.0001268 
seconds 


从 GC 日 志 中 找到 长 时 间 停顿 的 具体 日 志 信 息 (添加 了 - 
XX:+PrintReferenceGC 参 数 ) ， 找 到 的 日 志 片 段 如 下 所 示 。 从 日 志 
可 以 看 出 ， 真 正 执行 GC 动作 的 时 间 不 是 很 长 ， 但 从 准备 开始 GC， 到 
真正 开始 GC 之 间 所 消耗 的 时 间 却 占 了 绝 大 部 分 


2012-08-29T19:14:30.968+0800:10069.800:[GC10099 .225: 
[SoftReference, © refs, 0.0000109 secs]10099.226: [WeakReference, 
4072 refs, 0.0012099 secs]10099.227:[FinalReference, 984 refs, 
1.5822450 secs]10100.809:[PhantomReference, 251 refs, 0.0001394 
secs]10100.809:[JNI Weak Reference, 0.0994015 secs] 
[PSYoungGen:175672K- >8528K (167360K) ]251523K- >100182K (353152K) ， 
31.1580402 secs][Times:user=0.61 sys=0.52, real=31.16 Secs] 


除 GC 日 志 之 外 ， 还 观察 到 这 个 GUI 程 序 内 存 变化 的 一 个 特点 ， 当 
它 最 小 化 的 时 候 ， 资 源 管理 中 显示 的 占用 内 存 大 幅度 减 小 ， 但 是 虚拟 
内 存 则 没有 变化 ， 因 此 怀疑 程序 在 最 小 化 时 它 的 工作 内 存 被 自动 交换 
到 磁盘 的 页 面 文件 之 中 了 ， 这 样 发 生 GC 时 就 有 可 能 因为 恢复 页 面 文件 
的 操作 而 导致 不 正常 的 GC 停顿 。 


在 MSDN 上 查证 中 后 确认 了 这 种 猜想 ， 因 此 ， 在 Java 的 GUI 程 序 中 
要 避免 这 种 现象 ， 可 以 加 入 参数 "- 
Dsun.awt.keepWorkingSetOnMinimize=true" 来 解决 。 这 个 参数 在 许多 
AWT 的 程序 上 都 有 应 用 ， 例 如 JDK 自 带 的 Visual VM， 用 于 保证 程序 在 


dS 


恢复 最 小 化 时 能 够 立即 啊 应 。 在 这 个 案例 中 加 入 该 参数 后 ， 问 题 得 到 
解决 。 


[1] 本 案例 来 源 于 HLVM 组 和 群 的 讨论 
http://hllvm.group.iteye.com/group/topic/28745 ° 


[21http://support.microsoft.com/default.aspx?scid=kb;en-us;293215 ° 


5.3 ”实战 : Eclipse 运行 速度 调 优 


很 多 Java 开 发 人 员 都 有 这 样 一 种 观念 : 系统 调 优 的 工作 都 是 针对 服 
务 冰 应 用 而 言 ， 规 模 越 大 的 系统 ， 就 越 需 要 专业 的 调 优 和 运 维 团 队 参 
写 。 这 个 观点 不 能 说 不 对 ，5.2 廊 中 笔者 所 列举 的 案例 确实 都 是 服务 端 
运 维 、 调 优 的 例子 ， 但 服务 端 应 用 需要 调 优 ， 并 不 说 明 其 他 应 用 就 不 
需要 了 ， 作 为 一 个 普通 的 Java 开 发 人 员 ， 前 面 讲 的 各 种 虚拟 机 的 原理 和 
最 佳 实践 方法 距离 我 们 并 不 遥远 ， 开 发 者 号 边 很 多 场景 都 可 以 使 用 上 
面 这 些 知识 。 下 面 通 过 一 个 普通 程序 员 日 常 工作 中 可 以 随时 接触 到 的 
开发 工具 开始 这 次 实战 。 


5.3.1 ” 调 优 前 的 程序 运行 状态 


笔者 使 用 Eclipse 作 为 日 常 工作 中 的 主要 IDE 工 具 ， 由 于 安装 的 插件 
比较 大 (如 Klocwork、ClearCase LT 等 ) 、 代 码 也 很 多 ， 启 动 Eclipse 直 
到 所 有 项 目 编译 完成 需要 四 五 分 钟 。 一 直 对 开发 环境 的 速度 感觉 不 满 
意 ， 趁 着 编写 这 本 书 的 机 会 ， 决 定 对 Edlipse 进 行 “ 动 刀 ” 调 优 。 


笔者 机 器 的 Eclipse 运行 平台 是 32 位 Windows 7 系统 ， 虚 拟 机 为 
HotSpot VM 1.5 b64。 硬 件 为 ThinkPad X201，Intel i5 CPU，4GB 物 理 内 
存 。 在 初始 的 配置 文件 eclipse.ini 中 ， 除 了 指定 JDK 的 路 径 、 设 置 最 大 


堆 为 512MB 以 及 开启 了 JMX 管 理 (需要 在 VisualVM 中 收集 原始 数据 ) 
外 ， 未 做 其 他 任何 改动 ， 原 始 配 置 内 容 如 代码 清单 5-3 所 示 。 


代码 清单 5-3 Eclipse 3.5 初 始 配置 


-VM 
D:/_DevSpace/jdk1.5.0/bin/javaw.exe 
-startup 
plugins/org.eclipse.equinox.1launcher_1.0.201.R35x_v20090715.jar 
--launcher.1library 
plugins/org.eclipse.equinox.launcher .win32.win32.x86_1.0.200.v200 
90519 
-product 
org.eclipse.epp.package.jee.product 
--launcher .XXMaxPermSize 
256M 
-Showsplash 
org.eclipse.platform 
-vmargs 
-Dosgi.requiredJavaVersion=1.5 
-Xmx512m 
-Dcom. sun.management. jmxremote 


为 了 要 与 调 优 后 的 结果 进行 量化 对 比 ， 调 优 开始 前 笔者 先 做 了 一 
次 初始 数据 测试 。 测 试用 例 很 简单 ， 殉 是 收集 从 Eclipse 局 动 开始 ， 直 
到 所 有 插件 加 载 完成 为 止 的 总 耗 时 以 及 运行 状态 数据 ， 虚 拟 机 的 运行 
数据 通过 VisualVM 及 其 扩展 插件 VisualGC 进 行 采集 。 测 试 过 程 中 反复 
局 动 数 次 Eclipse 直到 测试 结果 稳定 后 ， 取 最 后 一 次 运行 的 结果 作为 数 
据 样本 (为 了 避免 操作 系统 未 能 及 时 进行 磁盘 缓存 而 产生 的 影响 ) ， 
数据 样本 如 图 5-2 所 示 。 


Spaces Graphs x 


Perm e Compile Time: 3556 compiles — 1.999s | 

I AL A ii 
rClass Loader Time: 9115 loaded, 35 unloaded 一 4 114s ] 
| 1 1 1 二 1 
ime: 397 collections, 4.149s Last [Cause- System. gc () 


i | 二 


rEden Space (31. 5008， 10. 562W): 9. 870W, 378 collections, 983. 345ms 


[Surviver 0 (3.938N, 1.250NM): 0 一 一 


| 
[Surviver 1 (3.938N, 1. 2501): 0 


roOld Gen (472.625M, 155.785M): 93. 470M, 19 collections，3 了 3. 166s 一 


rPerm Gen (256. 000N, 46.000N): 45.840W 


图 5-2 Eclipse 原始 运行 数据 


Eclipse 启动 的 总 耗 时 没有 办 法 从 监控 工具 中 直接 获得 ， 因 为 
VisualVM 不 可 能 知道 Eclipse 运行 到 什么 阶段 算是 局 动 完 成 。 为 了 测试 
的 准确 性 ， 笔 者 写 了 一 个 简单 的 Eclipse 插件 ， 用 于 统计 Eclipse 的 启动 
耗 时 。 由 于 代码 很 简单 ， 并 且 本 书 不 是 Eclipse RCP 开 发 的 教程 ， 所 以 
只 列 出 代码 清单 5-4 供 读者 参考 ， 不 再 延伸 讲解 。 如 有 果 读 者 需要 这 个 插 
件 ， 可 以 使 用 下 面 代码 自行 编译 或 者 发 电子 邮件 向 笔者 索取 。 


代码 清单 5-4 Eclipse 启动 耗 时 统计 插件 


ShowTime. java 代码 : 
import org.eclipse.jface.dialogs.MessageDialog.; 
import org.eclipse. swt .widgets.Display:; 


import org.eclipse. swt .widgets.Shell; 

import org.eclipse.ui,.IStartup; 

pA 

* 统 计 Ec1lipse 启 动 耗 时 

*@author zzm 

*/ 

public class ShowTime implements IStartup{ 

public void earlyStartup(){ 

Display.getDefault().syncExec (new Runnable(){ 

public void run(){ 

long eclipseStartTime=Long.parseLong (System.getProperty 
("eclipse,.startTime") ) ; 

long costTime=System.currentTimeMillis()-eclipseStartTime; 

Shell shell=Display.getDefault().getActiveShell(); 

String message="Eclipse 启 动 耗 时 : "+costTime+"ms"; 

MessageDialog.openInformation (shell, "Information", message) ; 

} 

}) ; 

} 


} 

plugin .xml 代 码 : 

<?xml] version="1.0"encoding="UTF-8"?> 

<?eclipse version="3.4"?> 

<plugin> 

<extension 

point="org.eclipse.ui.startup"> 

<startup class="eclipsestarttime.actions.ShowTime"/> 
</extension> 

</plugin> 


上 述 代码 打包 成 jar 后 放 到 Eclipse 的 plugins 目 录 ， 反 复 启 动 几 次 
后 ， 插 件 显 示 的 平均 时 间 稳 定 在 15 秒 左右 ， 如 图 5-3 所 示 “。 


:@: Information 


0 Eclipse 启动 耗 时 : 15896ms 
| | 


图 5-3 耗 时 统计 插件 运行 效果 


根据 VisualGC 和 Eclipse 插件 收集 到 的 信息 ， 总 结 原 始 配置 下 的 测试 
结果 如 下 。 


整个 启动 过 程 平均 耗 时 约 15 秒 。 

最 后 一 次 启动 的 数据 样本 中 ， 垃 圾 收集 总 耗 时 4.149 秒 ， 其 中 : 
eFull GC 被 触发 了 19 次 ， 共 耗 时 3.166 秒 。 

eMinor GC 被 触发 了 378 次 ， 共 耗 时 0.983 秒 。 

加 载 类 9115 个 ， 耗 时 4.114 秒 。 

JII 编 译 时 间 为 1.999 秒 。 


虚拟 机 512MB 的 堆 内 存 被 分 配 为 40MB 的 新 生 代 (31.5 的 Eden 空 间 
和 两 个 MB 的 Surviver 空 间 ) 以 及 472MB 的 老年 代 。 


客观 地 说 ， 由 于 机 器 硬件 还 不 错 (请 读者 以 2010 年 普通 PC 机 的 标 
准 来 衡量 ) ，15 秒 的 启动 时 间 其 实 还 在 可 接受 范围 以 内 ,但 是 从 
VisualGC 中 反映 的 数据 来 看 ， 主 要 问题 是 非 用 户 程 序 时 间 (图 5-2 中 的 
Compile Time、Class Load Time、GC Time) 非常 之 高 ， 占 了 整个 启动 
过 程 耗 时 的 一 半 以 上 《这 里 存在 少许 夸张 成 分 ， 因 为 如 JIT 编 译 等 动作 
是 在 后 台 线 程 完成 的 ， 用 户 程序 在 此 期 间 也 正常 执行 ， 所 以 并 没有 占 


用 了 一 半 以 上 的 绝对 时 间 ) 。 虚拟 机 后 台 占用 太 多 时 间 也 直接 导致 
Eclipse 在 局 动 后 的 使 用 过 程 中 经 常 有 不 时 停顿 的 感觉 ， 所 以 进行 调 优 
有 较 大 的 价值 。 


5.3.2 ”升级 JDK 1.6 的 性 能 变化 及 兼容 问题 


对 Eclipse 进行 调 优 的 第 一 步 就 是 先 把 虚拟 机 的 版 本 进行 升级 ， 和 希 
望 能 先 从 虚拟 机 版 本 身上 得 到 一 些 * 免 费 的 ”性 能 提升 。 


每 次 JDK 的 大 版 本 发 布 时 ， 开 发 商 肯 定 都 会 宣称 虚拟 机 的 运行 速度 
比 上 一 版 本 有 了 很 大 的 提高 ， 这 虽然 是 个 广告 性 质 的 宣言 ， 经 常 被 人 
从 升级 列表 或 者 技术 白皮书 中 直接 忽略 过 去 ， 但 从 国内 外 的 第 三 方 评 
测 数据 来 看 ， 版 本 升级 至 少 某 些 方面 确实 带 来 了 一 定 的 性 能 改善 和 ， 以 
下 是 一 个 第 三 方 网 站 对 JDK 1.5、1.6、1.7 三 个 版 本 做 的 性 能 评测 ， 分 别 
测试 了 以 下 4 个 用 例 呈 : 


生成 500 万 个 的 字符 串 。 
500 万 次 ArrayList< String> 数 据 插 入 ， 使 用 第 一 点 生成 的 数据 。 


生成 500 万 个 HashMap < String,Integer> ， 每 个 键 - 值 对 通过 并 发 线 
程 计算 ， 测试 并 发 能 


打印 500 万 个 ArrayList< String > 中 的 值 到 文件 ， 并 重读 回 内 存 。 


三 个 版 本 的 JDK 分 别 运行 这 3 个 用 例 的 测试 程序 ， 测 试 结果 如 图 5-4 
所 示 。 


Time (ms) 30000 


Java 1.7 
Java 1.6 


Java 1.5 


国 Java 1.5 1453 5600 11844 


国 Java 1.6 1250 | 5282 | 11328 56156 


图 5-4 JDK 横 向 性 能 对 比 


从 这 4 个 用 例 的 测试 结果 来 看 ，JDK 1.6 比 JDK 1.5 有 大 约 15% 的 性 
能 提升 ， 尽 管 对 JDK 仅 测试 这 4 个 用 例 并 不 能 说 明 什 么 问题 ， 需 要 通过 
测试 数据 来 量化 描述 一 个 JDK 比 旧版 提升 了 多 少 是 很 难 做 到 非常 科学 和 
准确 的 〈 要 做 稍微 靠 谱 一 点 的 测试 ， 可 以 使 用 SPECjvm200805 来 完成 ， 
或 者 把 相应 版 本 的 TCKI4 中 数 万 个 测试 用 例 的 性 能 数据 对 比 一 下 可 能 
有 说 服 力 ) ， 但 我 还 是 选择 相信 这 次 “ 软 广告 ?性质 的 测试 ， 把 JDK 版 本 
升级 到 1.6 Update 21。 


与 所 有 小 说 作者 设计 的 故事 情 下 一 样 ， 获 得 最 后 的 胜利 之 前 总 是 
要 经 历 各 种 各 样 的 挫 折 ， 这 次 升级 到 JDK 1.6 之 后 ， 性 能 有 什么 变化 先 
暂且 不 谈 ， 在 使 用 几 分 钟 之 后 ， 笔 着 的 Eclipse 束 和 前 面 儿 个 服务 端的 
案例 一 样 非 肖 “ 不 负 众 户 ” 地 发 生 了 内 和 存 浴 出 ， 如 图 5-5 所 示 。 


!@: Internal Exrror 


An out of memory error has occurred Consult the “Running Eclipse” section 
| of the read me file for information on preventine this kind of error in the 
future. 
You are recommended to exit the workbench. 
Subsequent errors may happen ard may terminate the workbench without 
Warninge. 
See the .log file for more details. 


Do you want to exit the workbench? 


图 5-5 Eclipse OutOfMemoryError 


这 次 内 存 淤 出 完全 出 平 笔者 的 意料 之 外 : 决定 对 Eclipse 做 调 优 是 
因为 速度 慢 ， 但 开发 环境 一 直 都 很 稳定 ， 至 少 没有 出 现 过 内 存 液 出 的 
问题 ， 而 这 次 升级 除了 eclipse.ini 中 的 JVM 路 径 改 变 了 之 外 ， 还 未 进行 
任何 运行 参数 的 调整 ， 进 到 Eclipse 主 界面 之 后 随便 打开 了 几 个 文件 就 
抛 出 内 存 洲 出 异常 了 ， 难 道 JDK 1.6 Update 21 有 哪个 API 出 现 了 严重 的 
泄漏 问题 吗 ? 


事实 上 ， 并 不 是 JDK 1.6 出 现 了 什么 问题 ， 根 据 前 面 章节 中 介绍 的 
相关 原理 和 工具 ， 我 们 要 查 明 这 个 异常 的 原因 并 且 解 决 它 一 点 也 不 困 


难 。 打 开 VisualVM， 监 视 页 签 中 的 内 存 曲 线 部 分 如 图 5-6 和 图 5-7 所 示 。 


| PermGen 


大 小 : 320, 815, 104 个 字 节 已 使 用 : 129, 489, 808 个 字 节 
最 大 : 536, 870, 912 个 字 节 


4d:31 


国 堆 大 小 国 使 用 的 堆 


图 5-6 Java 堆 监视 曲线 


堆 | PermGen | xX 


大 小 : 66, 584, 576 个 字 节 已 使 用 : 66, 459, 952 个 字 节 
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园 PermGen 大 小 国 使 用 的 PermGen 


图 5-7 永久 代 监 视 曲 线 


在 Java 堆 中 监视 曲线 中 ,“ 堆 大 小 ”的 曲线 与 “使 用 的 堆 ” 的 曲线 一 直 
都 有 很 大 的 间隔 距离 ， 每 当 两 条 曲线 开始 有 互相 靠近 的 趋势 时 , “最 大 
堆 ” 的 曲线 束 会 快速 回 上 转 辣 ， 而 “使 用 的 堆 ” 的 曲线 会 辐 下 转向 。“ 最 大 
扒 ” 的 曲线 向 上 有 是 虚拟 机 内 部 在 进行 堆 扩容 ， 运 行 参 数 中 并 没有 指定 最 
小 堆 (-Xms) 的 值 与 最 大 堆 (-Xmx) 相等 ， 所 以 堆 容量 一 开始 并 没有 
扩展 到 最 大 值 ， 而 是 根据 使 用 情况 进行 伸缩 扩展 。“ 使 用 的 堆 ” 的 曲线 
问 下 证 因为 虚拟 机 内 部 触发 了 一 次 垃圾 收集 ， 一 些 废弃 对 象 的 空间 被 
回收 后 ， 内 存 用 量 相 应 减少 ， 从 图 形 上 看 ，Java 堆 运作 是 完全 正 第 的 。 
但 永久 代 的 监视 曲线 就 有 问题 了 ,， “PermGen 大 小 ”的 曲线 与 “使 用 的 


PermGen” 的 曲线 几乎 完全 重合 在 一 起 ， 这 说 明永 久 代 中 没有 可 回收 的 
贷 源 ， 所 以 “使 用 的 PermGen” 的 曲线 不 会 同 下 发 展 ， 永 久 代 中 也 没有 空 
间 可 以 扩展 ， 所 以 “PermGen 大 小 ”的 曲线 不 能 同上 扩展 。 这 次 内 存 洲 出 
很 明显 古永 久 代 导 致 的 内 存 淤 出 。 


再 注意 到 图 5-7 中 永久 代 的 最 大 容量 : “67，108，864 个 字 节 ”， 也 
瓯 是 64MB ， 这 恰好 是 JDK 在 未 使 用 -XX:MaxPermSize 人 参数 明确 指定 永 
久 代 最 大 容量 时 的 默认 值 ， 无 论 JDK 1.5 还 是 JDK 1.6， 这 个 默认 值 都 是 
64MB。 对 于 Eclipse 这 种 规模 的 Java 程 序 来 说 ，64MB 的 永久 代 内 存 空 间 
显然 是 不 够 的 ， 淤 出 很 正 汕 ， 那 为 何在 JDK 1.5 中 没有 发 生 过 海 出 呢 ? 


在 VisualVM 的 “概述 -JVM 人 参数 ”页 签 中 ， 分 别 检查 使 用 JDK 1.5 和 
JDK 1.6 运 行 Eclipse 时 的 JVM 参 数 ， 发 现 使 用 JDK 1.6 时 ， 只 有 以 下 3 个 
JVM 参 数 ， 如 代码 清单 5-5 所 示 。 


代码 清单 5-5 JDK 1.6 的 Eclipse 运 行 期 参数 


-Dcom.sun.management. jmxremote 
-Dosgi.requiredJavaVersion=1.5 
-Xmx512m 


而 使 用 JDK 1.5 运 行 时 ， 束 有 4 条 JVM 人 参数 ， 其 中 多 出 来 的 一 条 正好 
就 是 设置 永久 代 最 大 容量 的 -XX:MaxPermSize=256M， 如 代码 清单 5-6 
所 示 。 


代码 清单 5-6 JDK 1.5 的 Eclipse 运行 期 参数 


-Dcom,Sun.management ,jmxremote 
-Dosgi.requiredJavaVersion=1.5 
-Xmx512m 

-XX:MaxPermSize=256M 


为 什么 会 这 样 呢 ? 笔者 从 Eclipse 的 Bug List 网 站 5 上 找到 了 答案 : 
使 用 JDK 1.5 时 之 所 以 有 永久 代 容 量 这 个 参数 ， 是 因为 在 eclipse.ini 中 存 
也 就 是 
Windows 下 的 可 执行 程序 eclipse.exe， 检 测 到 假如 是 Eclipse 运行 在 Sun 公 
司 的 虚拟 机 上 的 话 ， 就 会 把 参数 值 转化 为 -XX:MaxPermSize 传 递 给 虚拟 
机 进程 ， 因 为 三 大 商用 虚拟 机 中 只 有 Sun 系 列 的 虚拟 机 才 有 永久 代 的 概 
念 ， 也 就 是 只 有 HotSpot 虚 拟 机 需要 设置 这 个 参数 ，JRockit 虚 拟 机 和 
IBM J9 虚 拟 机 都 不 需要 设置 。 


在 "--launcher.XXMaxPermSize 256M" 这 项 设置 ， 当 launcher 


在 2009 年 4 月 20 日 ，Oracle 公 司 正 式 完成 了 对 Sun 公 司 的 收购 ， 此 后 
无 论 是 网 页 还 是 具体 程序 产品 ， 提 供 商 都 从 Sun 变 为 了 Oracle， 而 
eclipse.exe 就 是 根据 程序 提供 商 判 断 是 否 为 Sun 的 虚拟 机 ， 当 JDK 1.6 
Update 21 中 java.exe、javaw.exe 的 "Company" 属 性 从 "Sun Microsystems 
Inc." 变 为 "Oracle Corporation" 之 后 ，Eclipse 就 完全 不 认识 这 个 虚拟 机 
了 ， 因 此 没有 把 最 大 永久 代 的 参数 传递 过 去 。 


了 解 原因 之 后 ， 解 决 方法 吏 和 商 单 了 ，launcher 不 认识 束 只 好 由 人 来 
告诉 它 ， 即 在 eclipse.ini 中 明确 指定 -XX:MaxPermSize=256M 这 个 参数 就 


可 以 了 。 


[版 本 升级 也 有 不 少 性 能 倒退 的 案例 ， 受 程序 、 第 三 方 包 兼 容 性 以 及 
中 间 件 限制 ， 在 企业 应 用 中 升级 JDK 版 本 是 一 件 需 要 慎重 考虑 的 事情 。 
[2 测试 用例、 数据 及 图 片 来 目 : http://geeknizer.com/java-7-whats-new- 


performance-benchmark-1-5-1-6-1-7 

[3] 官 方 网 站 : http:/www.spec.org/jvm2008/docs/UserGuide.html。 
[4]TCK (Technology Compatibility Kit) 是 一 套 由 一 组 测试 用 例 和 相应 
的 测试 工具 组 成 的 工具 包 ， 用 于 保证 一 个 使 用 Java 技 术 的 实现 能 够 完全 
遵守 其 适用 的 Java 平 台 规范 ， 并 且 人 符合 相应 的 参考 实现 。 


[51lhttps://bugs.eclipse.org/bugs/show_bug.cgi?id=319514 ° 


5.3.3 ”编译 时 间 和 类 加 载 时 间 的 优化 


从 Eclipse 启动 时 间 上 来 看 ， 升 级 到 JDK 1.6 所 带 来 的 性 能 提升 
是 .….. 虽 ? 基本 上 没有 提升 ? 多 次 测试 的 平均 值 与 JDK 1.5 的 差距 完全 
在 实验 误差 范围 之 内 。 


各 位 读者 不 必 失 望 ，Sun JDK 1.6 性 能 白皮书 山 描 述 的 众多 相对 于 
JDK 1.5 的 提升 不 至 于 全 部 是 广告 ， 虽 然 总 启动 时 间 没 有 减少 ， 但 在 碍 
看 运行 细节 的 时 候 ， 却 发 现 了 一 件 很 值得 注意 的 事情 : 在 JDK 1.6 中 局 
动 完 Eclipse 所 消耗 的 类 加 载 时 间 比 JDK 1.5 长 了 接近 一 倍 ， 不 要 看 反 
了 ， 这 里 写 的 是 JDK 1.6 的 类 加 载 比 JDK 1.5 慢 一 倍 ， 测 试 结果 如 代码 清 
单 5-7 所 示 ， 反 复 测试 多 次 仍然 是 相似 的 结果 。 


代码 清单 5-7 JDK 1.5 和 JDK 1.6 中 的 类 加 载 时 间 对 比 


使 用 JDK 1.6 的 类 加 载 时 间 : 

C:\Users\IcyFenix>]jps 

3552 

6372 org.eclipse.equinox.1launcher_1.0.201.R35x_v20090715.jar 
6900 Jps 

C:\Users\IcyFenix>jstat-class 6372 

Loaded Bytes Unloaded Bytes Time 

7917 10190.3 0 0.0 8.18 

使 用 JDK 1.5 的 类 加 载 时 间 : 

C:\Users\IcyFenix>]jps 

3552 

7272 Jps 

7216 org.eclipse.equinox.launcher_1.0.201.R35x_v20090715.jar 
C:\Users\IcyFenix>jstat-class 7216 

Loaded Bytes Unloaded Bytes Time 

7902 9691.2 3 2.6 4.34 


在 本 例 中 ， 类 加 载 时 间 上 的 差距 并 不 能 作为 一 个 具有 普遍 性 的 测 
试 结 采 去 说 明 JDK 1.6 的 类 加 载 必 然 比 JDK 1.5 慢 ， 笔 者 测试 了 目 己 机 融 
上 的 Tomcat 和 GlassFish 局 动 过 程 ， 并 未 没有 出 现 类 似 的 差距 。 在 国内 
最 大 的 Java 社 区 中 ， 笔 者 发 起 过 关于 此 问题 的 讨论 局， 从 参与 者 反馈 的 
测试 结 采 来 看 ， 此 问题 只 在 一 部 分 机 器 上 存在 ， 而 且 JDK 1.6 的 各 个 
Update 版 之 间 也 存在 很 大 差异 。 


多 次 试验 后 ， 笔 者 发 现在 机 器 上 两 个 JDK 进 行 类 加 载 时 ， 字 节 码 验 
证 部 分 耗 时 差距 尤其 严重 。 考 虑 到 实际 情况 : Eclipse 使 用 者 甚 多 ， 它 
的 编译 代码 我 们 可 以 认为 是 可 靠 的 ， 不 需要 在 加 载 的 时 候 再 进行 字 节 
码 验证 ， 因 此 通过 参数 -Xverify:none 禁 止 掉 字 节 码 验证 过 程 也 可 作为 一 
项 优化 措施 。 加 入 这 个 参数 后 ， 两 个 版 本 的 JDK 类 加 载 速 度 都 有 所 提 
高 ，JDK 1.6 的 类 加 载 速度 仍然 比 JDK 1.5 慢 ， 但 是 两 者 的 耗 时 已 经 接近 
了 许多 ， 测 试 数据 如 代码 清单 5-8 所 示 。 关 于 类 与 类 加 载 的 话题 ， 璧 如 
刚刚 提 到 的 字 节 码 验 证 是 怎么 回 事 ， 本 书 专门 规划 了 两 个 章 世 进行 详 
细 讲 解 ， 在 此 不 再 延伸 讨论 。 


代码 清单 5-8 JDK 1.5 和 JDK 1.6 中 取消 字 节 码 验证 后 的 类 加 载 时 
间 对 比 


使 用 JDK 1.6 的 类 加 载 时 间 : 

C:\Users\IcyFenix>jps 

5512 org.eclipse.equinox.launcher_1.0.201.R35x_v20090715.jar 
5596 Jps 

C:\Users\IcyFenix>jstat-class 5512 


Loaded Bytes Unloaded Bytes Time 

6749 8837.0 0 0.0 3.94 

使 用 JDK 1.5 的 类 加 载 时 间 : 

C:\Users\IcyFenix>]jps 

4724 org.eclipse.equinox.1launcher_1.0.201.R35x_v20090715.jar 
5412 Jps 

C:\Users\IcyFenix>]jstat-class 4724 

Loaded Bytes Unloaded Bytes Time 

6885 9109.7 3 2.6 3.10 


在 取消 字 市 码 验 证 之 后 ，JDK 1.5 的 平均 启动 下 降 到 了 13 秒 ， 而 
JDK 1.6 的 测试 数据 平均 比 JDK 1.5 快 1 秒 ， 下 降 到 平均 12 秒 左右 ， 如 图 
5-8 所 示 。 在 类 加 载 时 间 仍 然 落 后 的 情况 下 ， 依 然 可 以 看 到 JDK 1.6 在 性 
能 上 比 JDK 1.5 稍 有 优势 ， 说 明 至 少 在 Eclipse 局 动 这 个 测试 用 例 上 ， 升 
级 JDK 版 本 确实 能 市 来 一 些 “ 免 费 的 ”性 能 提升 。 


0 Eclipse 启 动 耕 时 ; 12589ms 


图 5-8 运行 在 JDK 1.6 下 取消 字 节 码 验证 的 启动 时 间 


前 面 说 过 ， 除 了 类 加 载 时 间 以 外 ， 在 VisualGC 的 监视 曲线 中 显示 
了 两 项 很 大 的 非 用 户 程序 耗 时 : 编译 时 间 (Compile Time) 和 垃圾 收集 
时 间 (GC Time) 。 垃 圾 收集 时 间 读 者 应 该 非常 清楚 了 ， 而 编译 时 间 是 
什么 呢 ? 程序 在 运行 之 前 不 是 已 经 编译 了 吗 ? 虚拟 机 的 JIT 编 译 与 垃圾 
收集 一 样 ， 是 本 书 的 一 个 重要 部 分 ， 后 面 有 专门 章节 讲解 ， 这 里 移 简 


单 介绍 一 下 : 编译 时 间 是 指 虚 拟 机 的 JIT 编 译 器 (Just In Time 
Compiler) 编译 热点 代码 (Hot Spot Code) 的 耗 时 。 我 们 知道 Java 语 言 
为 了 实现 跨 平台 的 特性 ，Java 代 码 编译 出 来 后 形成 的 Class 文 件 中 存储 
的 是 字 节 码 (ByteCode) ， 虚 拟 机 通过 解释 方式 执行 字 节 码 命令 ， 比 
起 C/C++ 编译 成 本 地 二 进 制 代码 来 说 ， 速 度 要 慢 不 少 。 为 了 解决 程序 解 
释 执 行 的 速度 问题 ，JDK 1.2 以 后 ， 虚 拟 机 内 置 了 两 个 运行 时 编译 器 
中 ， 如 果 一 段 Java 方 法 被 调用 次 数 达 到 一 定 程 度 ， 就 会 被 判定 为 热 代 码 
交 给 JII 编 译 器 即时 编译 为 本 地 代码 ， 提 高 运行 速度 (这 就 是 HotSpot 虚 
拟 机 名 字 的 由 来 ) 。 甚 至 有 可 能 在 运行 期 动态 编译 比 C/C++ 的 编译 期 静 
态 译 编 出 来 的 代码 更 优秀 ， 因 为 运行 期 可 以 收集 很 多 编译 器 无 法 知道 
的 信息 ， 甚 至 可 以 采用 一 些 很 激进 的 优化 手段 ， 在 优化 条 件 不 成 立 的 
时 候 再 逆 优 化 退回 来 。 所 以 Java 程 序 只 要 代码 没有 问题 (主要 是 泄漏 问 
题 ， 如 内 存 泄漏 、 连 接 泄 漏 ; ， 随 着 代码 被 编译 得 越 来 越 彻 底 ， 运 行 
速度 应 当 是 越 运 行 越 快 的 。Java 的 运行 期 编译 最 大 的 缺点 就 是 它 进行 编 
译 需 要 消耗 程序 正常 的 运行 时 间 ， 这 也 就 是 上 面 所 说 的 “编译 时 间 ”。 


虚拟 机 提供 了 一 个 参数 -Xint 禁 止 编译 器 运作 ， 强 制 虚 拟 机 对 字 节 
码 采 用 纯 解 释 方 式 执行 。 如 果 读 者 想 使 用 这 个 参数 省 下 Eclipse 启 动 中 
那 2 秒 的 编译 时 间 获 得 一 个 “更 好 看 ”的 成 绩 的 话 ， 那 铸 怕 要 失望 了 ， 加 
上 这 个 参数 之 后 ， 虽 然 编 译 时 间 确 实 下 降 到 0， 但 Eclipse 启动 的 总 时 间 
剧 增 到 27 秒 。 看 来 这 个 参数 现在 最 大 的 作用 似乎 就 是 让 用 户 怀念 一 下 
JDK 1.2 之 前 那 令 人 心酸 和 心 碎 的 运行 速度 。 


与 解释 执行 相对 应 的 另 一 方面 ， 虚 拟 机 还 有 力度 更 强 的 编译 天 : 
当 虚 拟 机 运行 在 -client 模 式 的 时 候 ， 使 用 的 是 一 个 代号 为 C1 的 轻 量 级 纺 
译 右 ， 男 外 还 有 一 个 代号 为 C2 的 相对 重量 级 的 编译 颖 能 提供 更 多 的 优 
化 措施 ， 如 果 使 用 -server 模 式 的 虚拟 机 局 动 Eclipse 将 会 使 用 到 C2 编译 
锅 ， 这 时 从 VisualGC 可 以 看 到 局 动 过 程 中 虚拟 机 使 用 了 超过 15 秒 的 时 
间 去 进行 代码 编译 。 如 果 读 者 的 工作 习惯 是 长 时 间 不 关闭 Eclipse 的 
话 ，C2 编 译 器 所 消耗 的 额外 编译 时 间 最 终 还 是 会 在 运行 速度 的 提升 之 
中 赚 回 来 ， 这 样 使 用 -server 模 式 也 坪 一 个 不 错 的 选择 。 不 过 至 少 在 本 次 
实战 中 ， 我 们 还 是 继续 选用 -client 虚 拟 机 来 运行 Eclipse。 


[1 lhttp://www.oracle.com/technetwork/java/6-performance-137236.html ° 


[2] 关 于 JDK 1.6 与 JDK 1.5 在 Eclipse 启动 时 类 加 载 速 度 差异 的 讨论 : 


http://www.iteye.com/topic/826542 ° 
[3JDK 1.2 之 前 也 可 以 使 用 外 挂 JIT 编 译 器 进行 本 地 编译 ， 但 只 能 与 解释 
需 二 选 其 一 ， 不 能 同时 工作 。 


5.3.4 ”调整 内 存 设置 控制 垃圾 收集 频率 


三 大 块 非 用 户 程序 时 间 中 ， 还 剩 下 GC 时 间 没 有 调整 ， 而 GC 时 间 却 
又 是 其 中 最 重要 的 一 块 ， 并 不 只 是 因为 它 是 耗 时 最 长 的 一 块 ， 更 因为 
它 是 一 个 稳定 持续 的 过 程 。 由 于 我 们 做 的 测试 是 在 测 程序 的 启动 时 
间 ， 所 以 类 加 载 和 编译 时 间 在 这 项 测试 中 的 影响 力 被 大 幅度 放大 了 。 
在 绝 大 多 数 的 应 用 中 ， 不 可 能 出 现 持 续 不 断 的 类 被 加 载 和 番 载 。 在 程 
序 运行 一 段 时 间 后 ， 热 点 方法 被 不 断 编译 ， 新 的 热点 方法 数量 也 总 会 
下 降 ， 但 是 垃圾 收集 则 是 随 着 程序 运行 而 不 断 运 作 的 ， 所 以 它 对 性 能 
的 影响 才 显 得 尤为 重要 。 


在 Eclipse 启动 的 原始 数据 样本 中 ， 短 短 15 秒 ， 类 共 发 生 了 19 次 Full 
GC 和 378 次 Minor GC， 一 共 397 次 GC 共 造成 了 超过 4 秒 的 停顿 ， 也 就 是 
超过 1/4 的 时 间 都 是 在 做 垃圾 收集 ， 这 个 运行 数据 看 起 来 实在 太 糟 糕 
了 o 


首先 来 解决 新 生 代 中 的 Minor GC， 虽 然 GC 的 总 时 间 只 有 不 到 1 
秒 ， 但 却 发 生 了 378 次 之 多 。 从 VisualGC 的 线程 监视 中 看 到 ，Eclipse 启 
动 期 间 一 共 发 起 了 超过 70 条 线程 ， 同 时 在 运行 的 线程 数 超过 25 条 ， 每 
当 发 生 一 次 垃圾 收集 动作 ， 所 有 用 户 线程 趾 都 必须 跑 到 最 近 的 一 个 安全 
点 (SafePoint) 然后 挂 起 线程 等 待 垃圾 回收 。 这 样 过 于 频繁 的 GC 就 会 
导致 很 多 没有 必要 的 安全 点 检测 、 线 程 挂 起 及 恢复 操作 。 


新 生 代 GC 频 党 发 生 ， 很 明显 是 由 于 虚拟 机 分 配给 新 生 代 的 空间 太 
小 而 导致 的 ，Eden 区 加 上 一 个 Survivor 区 还 不 到 35MB。 因 此 很 有 必要 
使 用 -Xmn 参 数 调 整 狐 生 代 的 大 小 。 


再 来 看 一 看 那 19 次 Full GC， 看 起 来 19 次 并 “不 多 ” (相对 于 378 次 
Minor GC 来 说 )  ， 但 总 耗 时 为 3.166 秒 ， 占 了 GC 时 间 的 绝 大 部 分 ， 降 低 
GC 时 间 的 主要 目标 就 要 降低 这 部 分 上 时间。 从 VisualGC 的 曲线 图 上 可 能 
看 得 不 够 精确 ， 这 次 直接 从 GC 日 志 呈 中 分 析 一 下 这 些 Full GC 是 如 何 产 
生 的 ， 代 码 清 单 5-9 中 是 局 动 最 开始 的 2.5 秒 内 发 生 的 10 次 Full GC 记录 。 


代码 清单 5-9 Full GC 记录 


0.278:[GC 0.278:[DefNew:574K->33K (576K) , 0.0012562 secs]0.279: 
[Tenured:1467K- >997K (1536K) , 0.0181775 secs]1920K- >997K (2112K) ， 
0.0195257 secs] 

0.312:[GC 0.312:[DefNew:575K->64K (576K) , 0.0004974 secs]0.312: 
[Tenured:1544K- >1608K (1664K) ,0.0191592 secs]1980K->1608K 
(2240K) ，0.0197396 secs] 

0.590:[GC 0.590:[DefNew:576K->64K (576K) ， 0.0006360 secs]0.590: 
[Tenured:2675K- >2219K (2684K) ，0.0256020 secs]3090K- >2219K 
(3260K) ，0.0263501 secs] 

0.958:[GC 0.958:[DefNew:551K->64K (576K) , 0.0011433 secs]0.959: 
[Tenured:3979K- >3470K (4084K) ，0.0419335 secs]4222K->3470K 
(4660K) ，0.0431992 secs] 

1.575:[Full GC 1.575:[Tenured:4800K- >5046K (5784K) ，0.0543136 
secs]5189K- >5046K (6360K) ，[Perm:12287K- >12287K (12288K) ]， 
0.0544163 Secs] 

1.703:[GC 1.703:[DefNew:703K->63K (704K) ，0.0012609 secs]1.705: 
[Tenured:8441K- >8505K (8540K) ，0.0607638 secs]8691K- > 8505K 
(9244K) ，0.0621470 secs] 

1.837:[GC 1.837:[DefNew:1151K- >64K (1152K) ，0.0020698 
secs]1.839:[Tenured:14616K- >14680K (14688K) ，0.9708748 secs]15035K- 
>14680K (15840K) ,0.0730947 secs] 

2.144:[GC 2.144:[DefNew:1856K- >191K (1856K) ，0.0026810 
secs]2.147:[Tenured:25092K- >24656K (25108K) ，0.1112429 secs]26172K- 
>24656K (26964K) ,0.1141099 secs] 


2.337:[GC 2.337:[DefNew:1914K- >0K (3136K) ，0.0009697 secs]2.338: 
[Tenured:41779K- >27347K (42056K) ，0.0954341 secs]42733K- > 27347K 
(45192K) ，0.0965513 secs] 

2.465:[GC 2.465: [DefNew:2490K->0OK (3456K) , 0.0011044 secs]2.466: 
[Tenured:46379K- >27635K (46828K) ,0.0956937 secs]47621K->27635K 
(50284K) ，0.0969918 secs] 


括号 中 加 粗 的 数字 代表 老年 代 的 容量 ， 这 组 GC 日 志 显 示 了 10 次 
Full GC 发 生 的 原因 全 部 都 是 老年 代 空间 耗 尽 ， 每 发 生 一 次 Full GC 都 伴 
随 着 一 次 老年 代 空 间 扩容 ;1536KB- > 1664KB->2684KB..………. 
42056KB- > 46828KB，10 次 GC 以 后 老年 代 容量 从 起 始 的 1536KB 扩 大 
到 46828KB， 当 15 秒 后 Eclipse 启 动 完成 时 ， 老 年 代 容量 扩大 到 了 
103428KB， 代 码 编译 开始 后 ， 老 年 代 容量 到 达 顶 峰 473MB， 整 个 Java 


堆 到 达 最 大 容量 512MB 。 


日 志 还 显示 有 些 时 候 内 存 回 收 状况 很 不 理想 ， 空 间 扩容 成 为 获取 
可 用 内 存 的 最 主要 手段 ， 壁 如 语句 "Tenured:25092K- > 24656K 
(25108K) ，0.1112429 secs"， 代 表 老 年 代 当 前 容量 为 25108KB， 内 存 
使 用 到 25092KB 的 时 候 发 生 Full GC， 花 费 0.11 秒 把 内 存 使 用 降低 到 
24656KB， 只 回收 了 不 到 500KB 的 内 存 ， 这 次 GC 基本 没有 什么 回收 效 
果 ， 仅 仅 做 了 扩容 ， 扩 容 过 程 相 比 起 回收 过 程 可 以 看 做 是 基本 不 需要 
花费 时 间 的 ， 所 以 说 这 0.11 秒 几乎 是 白白 浪费 了 。 


由 上 述 分 析 可 以 得 出 结论 :， Eclipse 启动 时 ，Full GC 大 多 数 是 由 于 
老年 代 容 量 扩展 而 导致 的 ， 由 永久 代 衬 间 扩 展 而 导致 的 也 有 一 部 分 。 
为 了 避免 这 些 扩展 所 市 来 的 性 能 浪费 ， 我 们 可 以 把 -Xms 和 - 


XX:PermSize 参 数值 设置 为 -Xmx 和 -XX:MaxPermSize 参 数值 一 样 ， 这 样 
就 强制 虚拟 机 在 局 动 的 时 候 驶 把 老年 代 和 永久 代 的 容量 固定 下 来 ， 避 
免 运 行 时 上 自动 扩展 喇 。 


根据 分 机， 优化 计划 确定 为 : 把 新 生 代 容量 提升 到 128MB ， 避 免 
新 生 代 频繁 GC; 把 Java 堆 、 永 久 代 的 容量 分 别 固 定 为 512MB 和 
96MB 六 ， 避 免 内 存 扩展 。 这 几 个 数值 都 是 根据 机 器 硬件 、Eclipse 插 件 
和 工程 数量 来 决定 的 ， 读 者 实践 的 时 候 应 根据 VisualGC 中 收集 到 的 实 
际 数据 进行 设置 。 改 动 后 的 eclipse.ini 配 置 如 代码 清单 5-10 所 示 。 


代码 清单 5-10 内存 调 整 后 的 Eclipse 配置 文件 


-Vm 

D:/_DevSpace/jdk1.6.0 21/bin/javaw.exe 

-Startup 

plugins/org.eclipse.equinox.launcher_1.0.201.R35x_v20090715.jar 

--launcher.1library 

plugins/org.eclipse.equinox.launcher .win32.win32.x86_1.0.200.v200 
90519 

-product 

org.eclipse.epp.package.jee.product 

-showsplash 

org.eclipse.platform 

-vmargs 

-Dosgi.requiredJavaVersion=1.5 

-Xverify:none 

-Xmx512m 

-Xms512m 

-Xmn128m 

-XX:PermSize=96m 

-XX:MaxPermSize=96m 


现在 这 个 配置 之 下 ，GC 次 数 已 经 大 幅度 降低 ， 图 5-9 是 Eclipse 局 动 
后 1 分 钟 的 监视 曲线 ， 只 发 生 了 8 次 Minor GC 和 4 次 Full GC， 总 耗 时 为 
1.928 秒 
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图 5-9 GC 调整 后 的 运行 数据 


这 个 结果 已 经 算是 基本 正常 ， 但 是 还 存在 一 点 瑕 辛 ， 从 Old Gen 的 
曲线 上 看 ， 老 年 代 直接 固定 在 384MB ， 而 内 存 使 用 量 只 有 66MB ， 并 且 
一 直 很 平滑 ， 完 全 不 应 该 发 生 Full GC 才 对 ， 那 4 次 Full GC 是 怎么 来 
的 ? 使 用 jstat-gccause 查 询 一 下 最 近 一 次 GC 的 原因 ， 见 代码 清单 5-11 。 


代码 清单 5-11 ”查询 GC 原因 


C:\Users\IcyFenix>]jps 

9772 Jps 

4068 org.eclipse.equinox.1launcher_1.0.201.R35x_v20090715.jar 
C:\Users\IcyFenix>]jstat-gccause 4068 

SO Si EO P YGC YGCT FGC FGCT GCT LGCC GCC 

0.00 0.00 1.00 14.81 39.29 6 0.422 20 5.992 6.414 
System.gc()No GC 


从 LGCC (Last GC Cause) 中 看 到 ， 原 来 是 代码 调用 System.gc0O 显 
式 触发 的 GC， 在 内 存 设置 调整 后 ， 这 种 显 式 GC 已 不 符合 我 们 的 期 望 ， 
因此 在 eclipse.ini 中 加 入 参数 -XX:+DisableExplicitGC 屏 蔽 掉 
System.gc0。 再 次 测试 发 现 启 动 期 间 的 Full GC 已 经 完全 没有 了 ， 只 有 6 
次 Minor GC， 耗 时 417 毫 秒 ， 与 调 优 前 4.149 秒 的 测试 样本 相 比 ， 正 好 
是 十 分 之 一 。 进 行 GC 调 优 后 Eclipse 的 启动 时 间 下 降 非 常 明 显 ， 比 整个 
GC 时 间 降 低 的 绝对 值 还 大 ， 现 在 启动 只 需要 7 秒 多 ， 如 图 5-10 所 示 。 


'@: Information 


0 Eclipse 启 动 耗 时 ; 73T9ms 


图 5-10 Eclipse 启动 时 间 
[1] 严 格 来 说 ， 不 包括 正在 执行 native 代 码 的 用 户 线程 ， 因 为 native 代 码 
一 般 不 会 改变 Java 对 象 的 引用 关系 ， 所 以 没有 必要 挂 起 它们 来 等 竺 垃圾 
回收 。 


[2] 可 以 通过 以 下 儿 个 参数 要 求 虚拟 机 生成 GC 日 志 : 
XX:+PrintGCTimeStamps (打印 GC 停顿 时 间 ) 、-XX:+PrintGCDetails 
(打印 GC 详细 信息 ) 、-verbose:gc (打印 GC 信息 ， 输 出 内 容 已 被 前 一 
个 参数 包括 ， 可 以 不 写 ) 、-Xloggc:gc.log。 
[3] 需 要 说 明 一 点 ， 虚 拟 机 局 动 的 时 候 惑 会 把 参数 中 所 设 定 的 内 存 全 部 
划 为 私有 ， 即 使 扩容 前 有 一 部 分 内 存 不 会 被 用 户 代 码 用 到 ， 这 部 分 内 
存 也 不 会 交 给 其 他 进程 使 用 。 这 部 分 内 存在 虚拟 机 中 被 标识 
为 "Virtual" 内 存 。 
[4]1512MB 和 96MB 两 个 数 信 对 于 笔者 的 应 用 情况 来 说 依然 俩 少 ， 但 由 于 
笔者 需要 同时 开启 VMWare 工 作 ， 所 以 需要 预 留 较 多 内 存 ， 读 者 在 实际 
调 优 时 不 妨 再 设置 大 一 些 。 


5.3.5 ”选择 收集 器 降低 延迟 


现在 Eclipse 局 动 已 经 比较 迅 束 了 ， 但 我 们 的 调 优 实战 还 没有 结 
束 ， 毕 竟 Eclipse 征 拿 来 写 程序 的 ， 不 是 拿 来 测试 启动 速度 的 。 我 们 不 
妨 再 在 Eclipse 中 测试 一 个 非常 钊 用 但 又 比较 耗 时 的 操作 : 代码 编译 。 
图 5-11 是 当前 配置 下 Eclipse 进行 代码 编译 时 的 运行 数据 ， 从 图 中 可 以 看 
出 ， 新 生 代 每 次 回收 耗 时 约 65 毫 秒 ， 老 年 代 每 次 回收 耗 时 约 725 毫 秒 。 
对 于 用 户 来 说 ， 痢 生 代 GC 的 耗 时 还 好 ，65 受 秒 在 使 用 中 无 法 察觉 到 ， 
而 老年 代 每 次 GC 停 顿 接近 1 秒 钟 ， 虽 然 比 较 长 时 间 才 会 出 现 一 次 ， 但 


停顿 还 是 显得 太 长 了 一 些 。 
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图 5-11 编译 期 间 运 行 数据 


再 注意 看 一 下 编译 期 间 的 CPU 资源 使 用 状况 。 图 5-12 是 Eclipse 在 编 
译 期 间 的 CPU 使 用 率 曲 线 图 ， 整 个 编译 过 程 中 平均 只 使 用 了 不 到 30% 的 
CPU 资源 ， 垃 圾 收集 的 CPU 使 用 率 曲 线 更 是 几乎 与 坐标 横 轴 紧 贴 在 一 
起 ， 这 说 明 CPU 资 源 还 有 很 多 可 利用 的 余地 。 


CPU 
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图 5-12 编译 期 间 CPU 曲 线 


列举 GC 停 顿时 间 、CPU 资 源 主 余 的 目的 ， 都 是 为 了 接 下 来 奉 换 掉 
Client 模 式 的 虚拟 机 中 默认 的 新 生 代 、 老 年 代 串 行 收 集 右 做 铺 瓜 。 


Eclipse 应 当 算是 与 使 用 者 交互 非常 频 演 的 应 用 程序 ， 由 于 代码 大 
多 ， 笔 者 习惯 在 做 全 量 编译 或 者 清理 动作 的 时 候 ， 使 用 "Run in 
Backgroup" 功 能 一 边 编译 一 边 继 续 工 作 。 回 顾 一 下 在 第 3 章 提 到 的 几 种 
收集 右 ， 很 容易 想到 CMS 是 最 符合 这 类 场景 的 收集 器 。 因 此 党 试 在 
eclipse.ini 中 再 加 入 这 两 个 参数 -XX:+UseConcMarkSweepGC 、- 
XX:+UseParNewGC (ParNew 收 集 器 是 使 用 CMS 收 集 器 后 的 默认 新 生 代 
收集 器 ， 写 上 仅 是 为 了 配置 更 加 清晰 ) ， 要 求 虚 拟 机 在 新 生 代 和 老年 
代 分 别 使 用 ParNew 和 CMS 收集 器 进行 垃圾 回收 。 指 定 收 集 器 之 后 ， 再 
次 测试 的 结果 如 图 5-13 所 示 ， 与 原来 使 用 串 行 收集 历 对 比 ， 新 生 代 停顿 
从 每 次 65 训 秒 下 降 到 了 每 次 53 训 秒 ， 而 老年 代 的 停顿 时 间 更 是 从 725 训 
秒 大 幅 下 降 到 了 36 毫 秒 。 
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图 5-13 指定 ParNew 和 CMS 收集 器 后 的 GC 数 据 


当然 ，CMS 的 停顿 阶段 只 是 收集 过 程 中 的 一 小 部 分 ， 并 不 是 真 的 
把 垃圾 收集 时 间 从 725 豪 秒 变 成 36 训 秒 了 。 在 GC 日 志 中 可 以 看 到 CMS 
与 程序 并 发 的 时 间 约 为 400 训 秒 ， 这 样 收集 器 的 运作 结果 承 比 较 令 人 满 


二 O 
VC 


到 此 ， 对 于 虚拟 机 内 存 的 调 优 基本 吏 结 束 了 ， 这 次 实战 可 以 看 做 
征 一 次 催化 的 服务 端 调 优 过 程 ， 因 为 服务 端 调 优 有 可 能 还 会 存在 于 更 
多 方面 ， 如 数据 库 、 资 源 池 、 和 磁盘 IO 等 ， 但 对 于 虚拟 机 内 存 部 分 的 优 
化 ， 与 这 次 实战 中 的 思路 没有 什么 太 大 差别 。 即 使 读者 实际 工作 中 接 
触 不 到 服务 器 ， 根 据 目 己 工 作 环 境 做 一 些 试验 ， 总 结 几 个 参数 让 自己 
日 常 工 作 环 境 速 度 有 较 大 幅度 提升 也 是 很 划算 的 。 最 终 eclipse.ini 的 配 
置 如 代码 清单 5-12 所 示 。 


代码 清单 5-12 ”修改 收集 絮 配 置 后 的 Eclipse 配置 


-VM 

D:/_DevSpace/jdk1.6.0 21/bin/javaw.exe 

-startup 

plugins/org.eclipse.equinox.launcher_1.0.201.R35x_v20090715.jar 

--launcher.1library 

plugins/org.eclipse.equinox.1launcher .win32.win32.x86_1.0.200.v200 
90519 

-product 

org.eclipse.epp.package.jee.product 

-Showsplash 

org.eclipse.platform 

-vmargs 

-Dcom. sun.management. jmxremote 

-Dosgi.requiredJavaVersion=1.5 


-Xverify:none 

-Xmx512m 

-XmSs512m 

-Xmn1i28m 
-XX:PermSize=96m 
-XX:MaxPermSize=96m 
-XX:+DisableExplicitGC 
-Xnoclassgc 
-XX:+UseParNewGC 
-XX:+UseConcMarkSweepGC 
-XX:CMSINitiatingOccupancyFraction=85 


5.4 本章 小 结 


Java 虚 拟 机 的 内 存 管理 与 垃圾 收集 是 虚拟 机 结构 体系 中 最 重要 的 
组 成 部 分 ， 对 程序 的 性 能 和 稳定 性 有 非常 大 的 影响 ， 在 本 书 的 第 2~5 
章 中 ， 笔 着 从 理论 知识 、 异 闻 现 象 、 代 码 、 工 具 、 和 案例、 实战 等 儿 个 
方面 对 其 进行 了 讲解 ， 硕 望 读者 有 所 收获 。 


本 书 关 于 虚拟 机 内 存 管理 部 分 到 此 为 止 就 结束 了 ， 后 面 将 开始 介 
绍 Class 文 件 与 虚拟 机 执行 子 系统 方面 的 知识 。 


第 三 部 分 “虚拟 机 执行 子 系统 


第 6 章 “” 类 文件 结构 


第 7 章 ”虚拟 机 类 加 载 机 制 


第 8 草 ”虚拟 机 字 市 码 执 行 引 擎 


第 9 章 。 类 加 载 及 执行 子 系统 的 案例 与 实战 
第 6 草 ”类 文件 结构 


代码 编译 的 结果 从 本 地 机 器 码 转 变 为 子玉 码 ， 是 存储 格式 发 展 的 
一 小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


6.1 概述 


记得 在 第 一 节 计 算 机 程序 课 上 我 的 老师 就 讲 过 : “计算 机 只 认识 0 
和 1， 所 以 我 们 写 的 程序 需要 经 编译 器 翻译 成 由 0 和 1 构成 的 二 进 制 格式 
才能 由 计算 机 执行 ”。10 多 年 时 间 过 去 了 ， 今 天 的 计算 机 仍然 只 能 识别 
0 和 1， 但 由 于 最 近 10 年 内 虚拟 机 以 及 大 量 建立 在 虚拟 机 之 上 的 程序 语 
言 如 雨后春笋 般 出 现 并 篷 邯 发 展 ， 将 我 们 编写 的 程序 编译 成 二 进 制 本 
地 机 器 码 (Native Code) 已 不 再 是 唯一 的 选择 ， 越 来 越 多 的 程序 语言 


选择 了 与 操作 系统 和 机 右 指 令 集 无 关 的 、 平 台中 立 的 格式 作为 程序 编 
译 后 的 存储 格式 。 


6.2 无 关 性 的 基石 


如 果 计 算 机 的 CPU 指 令 集 只 有 x86 一 种 ， 操 作 系 统 也 只 有 Windows 
一 种 ， 那 也 许 Java 语 言 就 不 会 出 现 。Java 在 刚刚 诞生 之 时 曾经 提出 过 一 
个 非常 著名 的 宣传 口号 :“ 一 次 编写 ， 到 处 运行 《Write Once,Run 
Anywhere) ”， 这 句 话 充分 表达 了 软件 开发 人 员 对 冲破 平台 界限 的 渴 
求 。 在 无 时 无 刻 不 充 满 竞 争 的 IT 领域 ， 不 可 能 只 有 Wintel1 存 在 ， 我 们 
也 不 希望 只 有 Wintel 存 在 ， 各 种 不 同 的 硬件 体系 结构 和 不 同 的 操作 系统 
肯定 会 长 期 并 存 发 展 。“ 与 平台 无 关 ” 的 理想 最 终 实现 在 操作 系统 的 应 
用 层 上 : Sun 公 司 以 及 其 他 虚拟 机 提供 商 发 布 了 许多 可 以 运行 在 各 种 不 
同 平台 上 的 虚拟 机 ， 这 些 虚 拟 机 都 可 以 载 入 和 执行 同一 种 平台 无 关 的 
字 节 码 ， 从 而 实现 了 程序 的 “一 次 编写 ， 到 处 运行 ”。 


各 种 不 同 平台 的 虚拟 机 与 所 有 平台 都 统一 使 用 的 程序 存储 格式 
一 一 字 市 码 (ByteCode) 是 构成 平台 无 关 性 的 基石 ， 但 本 市 标题 中 刻 
意 省 略 了 “平台 ”二 字 ， 那 是 因为 笔者 注意 到 虚拟 机 的 另外 一 种 中 立 特 
性 一 一 语言 无 关 性 正 越 来 越 被 开发 者 所 重视 。 到 目前 为 止 ， 或 许 大 部 
分 程序 员 都 还 认为 Java 虚 拟 机 执行 Java 程 序 是 一 件 理所当然 和 天 经 地 义 
的 事情 。 但 在 Java 发 展 之 初 ， 设 计 者 就 曾经 考虑 过 并 实现 了 让 其 他 语言 
运行 在 Java 虚 拟 机 之 上 的 可 能 性 ， 他 们 在 发 布 规范 文档 的 时 候 ， 也 刻意 
把 Java 的 规范 拆 分 成 了 Java 语 言 规范 《The Java Language Specification》 


及 Java 虚 拟 机 规范 《The Java Virtual Machine Specification》。 并 且 在 
1997 年 发 布 的 第 一 版 Java 虚 拟 机 规范 中 就 曾经 承诺 过 : "In the future,we 
will consider bounded extensions to the Java virtual machine to provide 
better support for other languages”( 在 未 来 ， 我 们 会 对 Java 虚 拟 机 进行 适 
当 的 扩展 ， 以 便 更 好 地 支持 其 他 语言 运行 于 VM 之 上 ) ， 当 Java 虚 拟 机 
发 展 到 JDK 1.7~1.8 的 时 候 ，JVM 设 计 者 通过 JSR-292 基 本 兑现 了 这 个 承 
诡 。 


时 至 今日 ， 商 业 机 构 和 开源 机 构 已 经 在 Java 语 言 之 外 发 展 出 一 大 批 
在 Java 虚 拟 机 之 上 运行 的 语言 ， 如 Clojure、Groovy 、JRuby 、Jython 、 
Scala 等 。 使 用 过 这 些 语 言 的 开发 者 可 能 还 不 是 非常 多 ， 但 是 听 说 过 的 
人 肯定 已 经 不 少 ， 随 着 时 间 的 推移 ， 谁 能 保证 日 后 Java 虚 拟 机 在 语言 无 
关 性 上 的 优势 不 会 赶 上 甚至 超越 它 在 平台 无 关 性 上 的 优势 呢 ? 


实现 语言 无 天 性 的 基础 仍然 古 虚 拟 机 和 子 市 码 存储 格式 。Java 虚 拟 
机 不 和 包括 Java 在 内 的 任何 语言 绑 定 ， 它 只 与 “Class 文 件 ” 这 种 特定 的 二 
进 制 文件 格式 所 关联 ，Class 文 件 中 包含 了 Java 虚 拟 机 指令 集 和 符号 表 
以 及 奎 干 其 他 辅助 信息 。 基 于 安全 方面 的 考虑 ，Java 虚 拟 机 规范 要 求 在 
Class 文 件 中 使 用 许多 强制 性 的 语法 和 结构 化 约束 ， 但 任 一 门 功 能 性 语 
言 都 可 以 表示 为 一 个 能 被 Java 虚 拟 机 所 接受 的 有 效 的 Class 文 件 。 作 为 
一 个 通用 的 、 机 顺 无 关 的 执行 平台 ， 任 何其 他 语言 的 实现 者 都 可 以 将 
Java 庶 拟 机 作为 语言 的 产品 交付 媒介 。 例 如 ， 使 用 Java 编 译 副 可 以 把 


Java 人 代码 编译 为 存储 字 世 码 的 Class 文 件 ， 使 用 JRuby 等 其 他 语言 的 编译 
器 一 样 可 以 把 程序 代码 编译 成 Class 文 件 ， 虚 拟 机 并 不 关心 Class 的 来 源 
苹 何 种 语言 ， 如 图 6-1 所 示 。 


java 虚 拟 机 


图 6-1 Java 虚 拟 机 提供 的 语言 无 天性 


Java 语 言 中 的 各 种 变量 、 关 键 字 和 运算 符号 的 语义 最 终 都 是 由 多 条 
字 太 人 码 命令 组 合 而 成 的 ， 因 此 子 市 码 命 令 所 能 提供 的 语义 拉 述 能 力 肯 
定 会 比 Java 语 言 本 身 更 加 强大 。 因 此 ， 有 一 些 Java 语 言 本 身 无 法 有 效 文 
持 的 语言 符 性 不 代表 子 市 码 本 映 无 法 有 效 文 持 ， 这 也 为 其 他 语言 实现 
一 些 有 别 于 Java 的 语言 特性 提供 了 基础 。 


[11Wintel: 微软 公司 的 Windows 与 Intel 公 司 的 芯片 相 结 合 ， 曾 经 是 业界 
最 强大 的 联盟 。 


6.3 “Class 类 文件 的 结构 


解析 Class 文 件 的 数据 结构 是 本 章 的 最 主要 内 容 。 笔 者 曾经 在 前 言 
中 阐述 过 本 书 的 写作 风格 : 力求 在 保证 逻辑 准确 的 前 担 下 ， 用 尽量 通 
俗 的 语言 和 案例 去 讲述 虚拟 机 中 与 开发 关系 最 为 密切 的 内 容 。 但 是 ， 
对 数据 结构 方面 的 讲解 不 可 避免 地 会 比较 枯燥 ， 而 这 部 分 内 容 又 征 了 
解 虚拟 机 的 重要 基础 之 一 。 如 果 想 比较 深入 地 了 解 虚拟 机 ， 那 么 这 部 
分 古 不 能 不 接触 的 。 


在 本 章 关 于 Class 文 件 结构 的 讲解 中 ， 我 们 将 以 《Java 虚 拟 机 规范 
(第 2 版 ) 》 (1999 年 发 布 ， 对 应 于 JDK 1.4 时 代 的 Java 虚 拟 机 ) 中 的 定 
义 为 主线 ， 这 部 分 内 容 虽 然 古 老 ， 但 它 所 包含 的 指令 、 属 性 是 Class 文 
件 中 最 重要 和 最 基础 的 。 同 时 ， 我 们 也 会 以 后 续 JDK 1.5~JDK 1.7 中 添 
加 的 内 容 为 支线 进行 较为 简略 的 、 介 绍 性 的 讲解 ， 如 果 读 者 对 这 部 分 
内 容 特 别 感 兴趣 ， 建 议 参 考 笔者 所 翻译 的 《Java 虚 拟 机 规范 (Java SE 
7) 》 中 文 版 ， 可 以 在 笔者 的 网 站 (http://icyfenix.iteye.com/) 上 下 载 到 
这 本 书 的 全 文 PDF 。 


注意 ”任何 一 个 Class 文 件 都 对 应 着 唯一 一 个 类 或 接口 的 定义 信 
已， 但 反 过 来 说 ， 类 或 接口 并 不 一 定 都 得 定义 在 文件 里 (譬如 类 或 接 
口 也 可 以 通过 类 加 载 右 直接 生成 ) 。 本 章 中， 笔者 只 是 通俗 地 将 任意 


一 个 有 效 的 类 或 接口 所 应 当 满 足 的 格式 称 为 “Class 文件 格式 ”， 实 际 上 
筷 并 不 一 定 以 磁盘 文件 的 形式 存在 。 


Class 文 件 是 一 组 以 8 位 字 市 为 基础 单位 的 二 进 制 流 ， 各 个 数据 项 目 
严格 按照 顺序 紧凑 地 排列 在 Class 文 件 之 中 ， 中 间 没 有 添加 任何 分 隔 
符 ， 这 使 得 整个 Class 文 件 中 存储 的 内 容 几 乎 全 部 是 程序 运行 的 必要 数 
据 ， 没 有 空降 存在 。 当 过 到 需要 占用 8 位 字 节 以 上 空间 的 数据 项 时 ， 则 
会 按照 高 位 在 前 中 的 方式 分 割 成 者 干 个 8 位 字 市 进行 存储 。 


根据 Java 虚 拟 机 规范 的 规定 ，Class 文 件 格式 采用 一 种 类 似 于 C 语 言 
结构 体 的 伪 结 构 来 存储 数据 ， 这 种 伪 结 构 中 只 有 两 种 数据 类 型 ， 无 符 
号 数 和 表 ， 后 面 的 解析 都 要 以 这 两 种 数据 类 型 为 基础 ， 所 以 这 里 要 先 


介绍 这 两 个 概念 。 


无 符号 数 属于 基本 的 数据 类 型 ， 以 u1、u2、u4、u8 来 分 别 代表 1 个 
字 订 、2 个 字条 、4 个 字 季 和 8 个 字 市 的 无 符号 数 ， 无 符号 数 可 以 用 来 摘 
述 数字 、 索 引 引 用 、 效 量 值 或 者 按照 UTF-8 编 码 构成 字符 串 值 。 


表 是 由 多 个 无 符号 数 或 者 其 他 表 作为 数据 项 构成 的 复合 数据 类 
型 ， 所 有 表 都 习惯 性 地 以 " info" 结 尾 。 表 用 于 描述 有 层次 关系 的 复合 
结构 的 数据 ， 整 个 Class 文 件 本 质 上 束 古 一 张 表 ， 它 由 表 6-1 所 示 的 数据 
项 构成 。 


表 6-1 Class 文件 格式 


类 型 名 称 数 量 
u4 magic 1 
u2 minor_version 1 
u2 major_version 1 
u2 constant pool count 1 
cp_info constant pool constant pool count-1 
u2 access flags 1 
u2 this_class 1 
u2 super class 1 
u2 interfaces_count 1 
u2 interfaces interfaces_count 
u2 fields_count 1 
field_info fields fields_count 
u2 methods count 1 
method_info methods methods_ count 
u2 attributes_count 1 
attribute_info attributes attributes_count 


无 论 是 无 符号 数 还 是 表 ， 当 需要 描述 同一 类 型 但 数量 不 定 的 多 个 
数据 时 ， 经 常会 使 用 一 个 前 置 的 容量 计数 器 加 若干 个 连续 的 数据 项 的 
形式 ， 这 时 称 这 一 系列 连续 的 茶 一 类 型 的 数据 为 菏 一 类 型 的 集合 。 


本 节 结 束 之 前 ， 笔 者 需要 再 重复 讲 一 下 ，Class 的 结构 不 像 XML 等 
搞 述 语言 ， 由 于 它 没 有 任何 分 隔 符号 ， 所 以 在 表 6-1 中 的 数据 项 ， 无 论 

是 顺序 还 是 数量 ， 甚 至 于 数据 存储 的 字 节 序 (Byte Ordering,Class 文 件 
中 学 市 序 为 Big-Endian) 这 样 的 细节 ， 都 是 被 户 格 限定 的 ， 哪 个 字 季 代 
表 什 么 舍 义 ， 长 度 是 多 少 ， 先 后 顺序 如 何 ， 都 不 允许 改变 。 接 下 来 我 
们 将 一 起 看 看 这 个 表 中 各 个 数据 项 的 具体 含义 。 


6.3.1 ” 魔 数 与 Class 文 件 的 版 本 


每 个 Class 文 件 的 头 4 个 字 节 称 为 魔 数 (Magic Number) ， 它 的 唯一 
作用 是 确定 这 个 文件 是 否 为 一 个 能 被 虚拟 机 接受 的 Class 文 件 。 很 多 文 
件 存 储 标 准 中 都 使 用 魔 数 来 进行 身份 识别 ， 壁 如 图 片 格式 ， 如 gif 或 者 
jpeg 等 在 文件 头 中 都 存 有 魔 数 。 使 用 魔 数 而 不 是 扩展 名 来 进行 识别 主要 
是 基于 安全 方面 的 考虑 ， 因 为 文件 扩展 名 可 以 随意 地 改动 。 文 件 格式 
的 制定 者 可 以 自由 地 选择 魔 数值 ， 只 要 这 个 魔 数值 还 没有 被 广泛 采用 
过 同时 又 不 会 引起 混淆 即 可 。Class 文 件 的 魔 数 的 获得 很 有 “浪漫 气 
轧 ”， 值 为 : 0xXCAFEBABE (咖啡 宝贝 ? ) ， 这 个 魔 数值 在 Java 还 称 
做 "Oak" 语 言 的 时 候 (大 约 是 1991 年 前 后 ) 就 已 经 确定 下 来 了 。 它 还 有 
一 段 很 有 趣 的 历史 ， 据 Java 开 发 小 组 最 初 的 关键 成 员 Patrick Naughton 所 
说 : “我 们 一 直 在 寻找 一 些 好 玩 的 、 容 易 记 忆 的 东西 ， 选 择 
0xCAFEBABE 是 因为 它 象征 着 著名 咖啡 品牌 Peet's Coffee 中 深 受 欢迎 的 
Baristas 咖 啡 ?， 这 个 魔 数 似乎 也 预示 着 日 后 "Java" 这 个 商标 名 称 的 出 
更。 


紧 接 着 魔 数 的 4 个 字 节 存储 的 是 class 文件 的 版 本 号 : 第 5 和 第 6 个 字 
节 是 次 版 本 号 (Minor Version) ， 第 7 和 第 8 个 字 节 是 主 版 本 号 (Major 
Version) 。Java 的 版 本 号 是 从 45 开 始 的 ，JDK 1.1 之 后 的 每 个 JDK 大 版 
本 发 布 主 版 本 号 向 上 加 1 (JDK 1.0~1.1 使 用 了 45.0~45.3 的 版 本 号 ) ， 高 
版 本 的 JDK 能 向 下 兼容 以 前 版 本 的 Class 文 件 ， 但 不 能 运行 以 后 版 本 的 
Class 文 件 ， 即 使 文件 格式 并 未 发 生 任何 变化 ， 虚 拟 机 也 必须 拒绝 执行 
超过 其 版 本 号 的 Class 文 件 。 


例如 ，JDK 1.1 能 支持 版 本 号 为 45.0~45.65535 的 Class 文 件 ， 无 法 执 
行 版 本 号 为 46.0 以 上 的 Class 文 件 ， 而 JDK 1.2 则 能 支持 45.0~46.65535 的 
Class 文 件 。 现 在 ， 最 新 的 JDK 版 本 为 1.7， 可 生成 的 Class 文 件 主 版 本 号 
最 大 值 为 51.0。 


为 了 讲解 方便 ， 笔 者 准备 了 一 段 最 简单 的 Java 代 码 〈 见 代码 清单 6- 
1) ， 本 章 后 面 的 内 容 都 将 以 这 段 小 程序 使 用 JDK 1.6 编 译 输出 的 Class 
文件 为 基础 来 进行 讲解 。 


代码 清单 6-1 简单 的 Java 代 码 


package org.fenixsoft.clazz; 
public class TestClasst 
private int m; 

public int inc()t{ 

return m+1; 


} 


图 6-2 显 示 的 是 使 用 十 六 进 制 编辑 器 WinHex 打 开 这 个 Class 文 件 的 结 
果 ， 可 以 清楚 地 看 见 开头 4 个 字 节 的 十 六 进 制 表示 是 0xCAFEBABE， 代 
表 次 版 本 号 的 第 5 个 和 第 6 个 字 节 值 为 0x0000， 而 主 版 本 号 的 值 为 
0x0032， 也 即 是 十 进 制 的 50， 该 版 本 号 说 明 这 个 文件 是 可 以 被 JDK 1.6 
或 以 上 版 本 虚拟 机 执行 的 Class 文 件 。 


Offsaet a i = 2 
00000000 CA FE BA BE 00 00 00 一 00 16 07 00 01 
00000010 6F 72 67 2F 66 65 光 5 营 寺 加 腕 号 63 6C orgq/Fenixsoft/cl 


00000020 61 7& 7A 2F 54 65 1 00 04 azz/TestClass,.. 
00000030 01 00 10 6A 61 76 a - 8 BiG 50 62 6A | ...java/lang/Ob 


图 6-2 Java Class 文件 的 结构 


表 6-2 列 出 了 从 JDK 1.1 到 JDK 1.7， 主 流 JDK 版 本 编译 器 输出 的 默认 
和 可 支持 的 Class 文 件 版 本 号 。 


表 6-2 Class 文件 版 本 号 


编译 器 版 本 -target 参数 十 六 进 制版 本 号 十 进 制版 本 号 
JDK 1.1.8 不 能 带 target 参数 00 03 00 2D 45.3 


JDK 1.2.2 不 带 〈 默 认为 -target 1.1) 00 03 00 2D 45.3 


JDK 1.3.1 19 不 带 《〈 默 认为 -target 1.1) 00 03 00 2D 45.3 


JDK 1.4.2_10 不 带 〈 默 认为 -target 1.2) 00 00 00 2E 46.0 
JDK 1.4.2_10 -target 1.4 00 00 00 30 48.0 
JDK 1.5.0_11 不 带 〈 默 认为 -target 1.5) 00 00 00 31 49.0 


JDK 1.6.0 01 不 带 〈 默 认为 -target 1.6) 50.0 


JDK 1.7.0 不 带 〈 默 认为 -target 1.7) 00 00 00 33 51.0 
JDK 1.7.0 -target 1.6 00 00 00 32 50.0 
00 00 00 30 48.0 


JDK 1.7.0 -target 1.4 -source 1.4 


[1] 这 种 顺序 称 为 "Big-Endian"， 具 体 是 指 最 高 位 字 节 在 地 址 最 低位 、 最 
低位 字 市 在 地 址 最 高 位 的 顺序 来 存储 数据 ， 它 是 SPARC、PowerPC 等 处 
理 器 的 默认 多 字 节 存储 顺序 ， 而 x86 等 处 理 器 则 是 使 用 了 相反 的 "Little- 
Endian" 顺 序 来 存储 数据 。 


6.3.2 ”常量 池 


暴 接着 主 次 版 本 号 之 后 的 是 音量 池 入 口 ， 和 常量 池 可 以 理解 为 Class 
文件 之 中 的 资源 仓库 ， 它 是 Class 文 件 结构 中 与 其 他 项 目 关 联 最 多 的 数 
据 类 型 ， 也 是 占用 Class 文 件 空 间 最 大 的 数据 项 目 之 一 ， 同 时 它 还 是 在 
Class 文 件 中 第 一 个 出 现 的 表 类 型 数据 项 目 。 


由 于 常量 池 中 常量 的 数量 是 不 国定 的 ， 所 以 在 常量 池 的 入 口 需要 

放置 一 项 u2 类 型 的 数据 ， 代 表 句 量 池 容 量 计数 值 

(constant_pool_count) 。 与 Java 中 语言 习惯 不 一 样 的 是 ， 这 个 容量 计 
数 是 从 1 而 不 是 0 开始 的 ， 如 图 6-3 所 示 ， 常 量 池 容 量 ( 偏 移 地 址 : 
0x00000008) 为 十 六 进 制 数 0x0016， 即 十 进 制 的 22， 这 就 代表 常量 池 
中 有 21 项 常量 ， 索 引 值 范围 为 1~21。 在 Class 文 件 格式 规范 制定 之 时 ， 
设计 者 将 第 0 项 常量 空 出 来 是 有 特殊 考虑 的 ， 这 样 做 的 目的 在 于 满足 后 
面 某 些 指向 常量 池 的 索引 值 的 数据 在 特定 情况 下 需要 表达 “不 引用 任何 
一 个 冲 量 池 项 目的 含义， 这 种 情况 融 可 以 把 索引 值 置 为 0 来 表示 。 
Class 文 件 结构 中 只 有 常量 池 的 容量 计数 是 从 1 开始 ， 对 于 其 他 集合 
型 ， 包 括 接口 索引 集合 、 字 段 表 和 集合、 方法 表 和 集合 等 的 容量 计数 都 与 
一 般 习 惯 相 同 ， 是 从 0 开始 的 。 


1 时 
CA FE BA BE 00 42 ‘00 0 On ne 


BE T2606 ZF .66 78: RI 6E 66 74:2EF 6 org/fenixsoft/cl 

Bl TA Zh 2F 54 4 bl bi 3 7 0 D000 azz/TestClass... 
00000030 |01 00 10 6A 61 : 6| 数 闫 钙 释 如 6 ... java/lang/Ob]j 
00000040 ‘65 63 74 01 00 hb9 | eben me le ri 
[ S50 六 站 7 F 要 oy Vv 


图 6-3 常量 池 结 构 


常量 池 中 主要 存放 两 大 类 名 量 : 字面 量 (Literal) 和 符号 引用 
(Symbolic References) 。 字 面 量 比较 接近 于 Java 语 言 层 面 的 常量 概 
念 ， 如 文本 字符 串 、 声 明 为 final 的 前 量 值 等 。 而 符号 引用 则 属于 编译 原 
理 方面 的 概念 ， 包 括 了 下 面 三 类 常量 : 


类 和 接口 的 全 限定 名 (Fully Qualified Name) 
字段 的 名 称 和 描述 符 (Descriptor) 
方法 的 名 称 和 描述 符 


Java 代 码 在 进行 Javac 编 译 的 时 候 ， 并 不 像 C 和 C++ 那样 有 “连接 ”这 
一 步骤 ， 而 是 在 虚拟 机 加 载 Class 文 件 的 时 候 进 行动 态 连 接 。 也 束 是 
说 ， 在 Class 文 件 中 不 会 保存 各 个 方法 、 字 段 的 最 终 内 存 布局 信息 ， 
此 这 些 字 段 、 方 法 的 符号 引用 不 经 过 运行 期 转换 的 话 无 法 得 到 真正 的 
内 存 入 口 地 址 ， 也 惑 无 法 直接 被 虚拟 机 使 用 。 当 虚拟 机 运行 时 ， 需 要 
从 凋 量 池 获 得 对 应 的 符号 引用 ， 再 在 类 创建 时 或 运行 时 解析 、 翻 译 到 


具体 的 内 存 地址 之 中 。 关 于 类 的 创建 和 动态 连接 的 内 容 ， 在 下 一 章 介 
绍 虚 拟 机 类 加 载 过 程 时 再 进行 详细 讲解 。 


香 量 池 中 每 一 项 音量 都 是 一 个 表 ， 在 JDK 1.7 之 前 共有 11 种 结构 各 
不 相同 的 表 结 构 数 据 ， 在 JDK 1.7 中 为 了 更 好 地 文 持 动态 语言 调用 ， 又 
额外 增加 了 3 种 (CONSTANT_MethodHandle_info、 
CONSTANT_MethodType_info 和 CONSTANT_InvokeDynamic_info, 本 
章 不 会 涉及 这 3 种 新 增 的 类 型 ， 在 第 8 章 介 绍 字 市 码 执行 和 方法 调用 
时 ， 将 会 详细 讲解 ) 。 


这 14 种 才 都 有 一 个 共同 的 特点 ， 束 是 表 开 始 的 第 一 位 是 一 个 ul 类 
型 的 标志 位 (tag， 取 值 见 表 6-3 中 标志 列 ) ， 代 表 当 前 这 个 常量 属于 哪 
种 常量 类 型 。 这 14 种 第 量 类 型 所 代表 的 具体 含义 见 表 6-3。 


表 6-3 常量 池 的 项 目 类 型 


类 型 标 志 描 述 
CONSTANT Utf8_info 1 UTF-8 编码 的 字符 串 
CONSTANT Integer_info 3 整 型 字面 量 
CONSTANT Float info 4 浮 点 型 字面 量 
CONSTANT Long info 5 长 整 型 字面 量 
CONSTANT Double _info 6 双 精 度 浮 点 型 字面 量 
CONSTANT Class_info 7 类 或 接口 的 符号 引用 
CONSTANT String_info 8 字符 串 类 型 字面 量 
CONSTANT Fieldref info 9 字段 的 符号 引用 
CONSTANT_Methodref info 10 类 中 方法 的 符号 引用 
CONSTANT InterfaceMethodref info 11 接口 中 方法 的 符号 引用 
CONSTANT NameAndType info 12 字段 或 方法 的 部 分 符号 引用 
CONSTANT_ MethodHandle_info 15 表示 方法 句柄 
CONSTANT _ MethodType info 16 标识 方法 类 型 
CONSTANT InvokeDynamic info 18 表示 一 个 动态 方法 调用 点 


之 所 以 说 常量 池 是 最 烦琐 的 数据 ， 是 因为 这 14 种 常量 类 型 各 自 均 
有 上 自己 的 结构 。 回 头 看 看 图 6-3 中 常量 池 的 第 一 项 种 量 ， 它 的 标志 位 
( 偏 移 地 址 : 0x0000000A) 是 0x07， 查 表 6-3 的 标志 列 发 现 这 个 常量 属 
于 CONSTANT_Class_info 类 型 ， 此 类 型 的 常量 代表 一 个 类 或 者 接口 的 
符号 引用 。CONSTANT_Class_info 的 结构 比较 简单 ， 见 表 6-4 。 


表 6-4 CONSTANT_Class_info 型 常量 的 结构 
类 型 名 称 数 量 
ul | tag | 1 


U2 name index 1 


tag 古 标志 位 ， 上 面 已 经 讲 过 了 ， 它 用 于 区 分 常量 类 型 ， 


name_index 是 一 个 索引 值 ， 它 指向 常量 池 中 一 个 CONSTANT_Utf8_info 
类 型 常量 ， 此 常量 代表 了 这 个 类 (或 者 接口 ) 的 全 限定 名 ， 这 里 
name_index 值 〈 偏 移 地 址 : 0x0000000B) 为 0x0002， 也 即 是 指向 了 党 
量 池 中 的 第 二 项 常量 。 继 续 从 图 6-3 中 查找 第 二 项 常量 ， 它 的 标志 位 
(地 址 : 0x0000000D) 是 0x01， 查 表 6-3 可 知 确实 是 一 个 


CONSTANT_Utf8_info 类 型 的 常量 。CONSTANT _Utf8_info 类 型 的 结构 
见 表 6-5。 


表 6-5 CONSTANT_Utf8_info 型 常量 的 结构 
Ee 型 名 称 数 量 


ul tag 1 


u2 length 1 


ul bytes length 


length 值 说 明了 这 个 UTF-8 编 码 的 字符 串 长 度 是 多 少 字 节 ， 它 后 面 
紧 跟着 的 长 度 为 length 字 节 的 连续 数据 是 一 个 使 用 UTF-8 缩 略 编 码 表示 
的 字符 串 。UTF-8 缩 略 编码 与 普通 UTF-8 编 码 的 区 别 是 : 
从 Nu0001' 到 Nu007f 之 间 的 字符 (相当 于 1~127 的 ASCII 码 ) 的 缩 略 编码 
使 用 一 个 字 节 表示 ， 从 \u0080' 到 Au07 人 ff 之 间 的 所 有 字符 的 缩 略 编码 用 
两 个 字 节 表 示 ， 从 \u0800' 到 Auffff 之 间 的 所 有 字符 的 缩 略 编码 就 按照 普 
通 UTF-8 编 码 规则 使 用 三 个 字 世 表示 。 


顺便 提 一 下 ， 由 于 Class 文 件 中 方法 、 字 段 等 都 需要 引用 
CONSTANT _Utf8_info 型 负 量 来 描述 名 称 ， 所 以 CONSTANT _Utf8_info 
型 常量 的 最 大 长 度 也 就 是 Java 中 方法 、 字 段 名 的 最 大 长 度 。 而 这 里 的 最 
大 长 度 就 是 length 的 最 大 值 ， 既 u2 类 型 能 表达 的 最 大 值 65535。 所 以 Java 
程序 中 如 果 定 义 了 超过 64KB 英 文字 符 的 变量 或 方法 名 ， 将 会 无 法 编 


译 。 


本 例 中 这 个 字符 串 的 length 值 ( 偏 移 地 址 :0x0000000E) 为 
0x001D， 也 就 是 长 29 字 节 ， 往 后 29 字 节 正 好 都 在 1~127 的 ASCII 码 范围 
以 内 ， 内 容 为 "org/fenixsoft/clazz/TestClass"， 有 兴趣 的 读者 可 以 自己 逐 
个 字 节 换算 一 下 ， 换 算 结 果 如 图 6-4 选 中 的 部 分 所 示 


[© 


Oarsst | Jj We 
00000000 CA FE BA BE 00 00 00 32 00 2 
00000010 E72 N72r oesers 73 6F 6C org/fenixsoft/cl 


0000002 bl 7A 7A 2F 54 65 73 74 人 和 | 04 azz7IestClasi... 
0000003 01 00 10 6A 61 76 61 2F 6l 6E 67 2F 4F Ba ...java-lang~obj 


图 6-4 常量 池 UTF-8 字 符 串 结构 


到 此 为 止 ， 我 们 分 析 了 TestClass.class 常 量 池 中 21 个 常量 中 的 两 

个 ， 其 余 的 19 个 常量 都 可 以 通过 类 似 的 方法 计算 出 来 。 为 了 避免 计算 
过 程 占用 过 多 的 版 面 ， 后 续 的 19 个 利 量 的 计算 过 程 可 以 借助 计算 机 来 
帮 我 们 完成 。 在 JDK 的 bin 目 录 中 ，Oradle 公 司 已 经 为 我 们 准备 好 一 个 专 
门 用 于 分 析 Class 文 件 字 节 码 的 工具 : javap， 代 码 请 和 单 6-2 中 列 出 了 使 用 
javap 工 具 的 -verbose 参 数 输 出 的 TestClass.class 文 件 字 市 码 内 容 (此 清单 
中 省 略 了 和 常量 池 以 外 的 信息 ) 。 前 面 我 们 曾经 提 到 过 ，Class 文 件 中 还 
有 很 多 数据 项 都 要 引用 向 量 池 中 的 常量 ， 所 以 代码 清单 6-2 中 的 内 容 在 
后 续 的 讲解 过 程 中 还 要 经 党 使 用 到 。 


代码 清单 6-2 ”使 用 Javap 命 令 输出 常量 表 


C:\>javap-verbose TestClass 

Compiled from"TestClass.java" 

public class org.fenixsoft.clazz.TestClass extends 
java.1lang.Object 

SourceFile:"TestClass.java" 

minor version:0 

major version:50 

Constant pool: 

const#1=class#2; //org/fenixsoft/clazz/TestClass 

const#2=Asciz org/fenixsoft/clazz/TestClass:; 

const#3=class#4; //java/lang/Object 

const#4=Asciz java/lang/0Object; 

const#5=Asciz m; 

const#6=Asciz 工 ; 

const#7=Asciz<init>; 

const#8=Asciz( )V; 

const#9=Asciz Code; 

const#10=Method#3.#11; //java/lang/Object."<init>":()V 

const#11=NameAndType#7:#8; //"<init>":()V 


const#12=Asciz LineNumberTable; 

const#13=Asciz LocalVariableTable.; 

const#14=Asciz this; 

const#15=Asciz Lorg/fenixsoft/clazz/TestClass; 
const#16=Asciz Inc; 

const#17=Asciz( )I; 

const#18=Field#1.#19; //org/fenixsoft/clazz/TestClass.m:I 
const#19=NameAndType#5:#6; //m:I 

const#20=Asciz SourceFile; 

const#21=Asciz TestClass.java; 


从 代码 清单 6-2 中 可 以 看 出 ， 计 算 机 已 经 帮 我 们 把 整个 常量 池 的 21 
项 常量 都 计算 了 出 来 ， 并 且 第 1、2 项 常量 的 计算 结果 与 我 们 手工 计算 
的 结 采 一 致 。 仔 细 看 一 下 会 发 现 ， 其 中 有 一 些 常 量 似乎 从 来 没有 在 代 
码 中 出 现 过 ， 如 "I 、"V"、 "<init 
>"、"LineNumberTable"、"LocalVariableTable" 等 ， 这 些 看 起 来 在 代码 
任何 一 处 都 没有 出 现 过 的 常量 是 哪里 来 的 呢 ? 


这 部 分 自动 生成 的 常量 的 确 没有 在 Java 代 码 里 面 直接 出 现 过 ， 但 它 

们 会 被 后 面 即将 讲 到 的 字段 表 (field_info) 、 方 法 表 

(method_info) 、 属 性 表 (attribute_info) 引用 到 ， 它 们 会 用 来 描述 一 
些 不 方便 使 用 “固定 字 节 ”进行 表达 的 内 容 。 壁 如 描述 方法 的 返回 值 是 
什么 ? 有 几 个 参数 ? 每 个 参数 的 类 型 是 什么 ?因为 Java 中 的 “类 ”是 无 穷 
无 尽 的 ， 无 法 通过 简单 的 无 符号 字 贡 来 描述 一 个 方法 用 到 了 什么 类 ， 
因此 在 描述 方法 的 这 些 信息 时 ， 需 要 引用 常量 表 中 的 符号 引用 进行 表 
达 。 这 部 分 内 容 将 在 后 面 进 一 步 前 述 。 最 后 ， 笔 者 将 这 14 种 常量 项 的 


结构 定义 总 结 为 表 6-6 以 供 读者 参考 。 


表 6-6 常量 池 中 的 14 种 常量 项 的 结构 总 表 


1] rE 
| 

CONSTANT Ut8 info | length | ww | UTF-g 编 码 的 字符 串 占用 的 字 节 数 

CONSTANT Inteser | ts | MW | 值 为 

om ET 
1 

CONSTANT Float info 二 二 
[as 
es 

CONSTANT_Long_info ee 
[as 

CONSTANT Double | tg | 是 | 值 为 

nt TE 

CONSTANT Class_info : FRR s 3 
TT 
ET 

CONSTANT String info 上 RE 
让 
EE 


2 吉明 ar En 自 类 或 b; 加 订 给 
CONSTANT Fieldref index u2 指向 下 国字 恬 的 类 息 者 搁 捕 述 答 
jh 证 CONSTANT_Class_info 的 索引 项 
i 
指向 字段 描述 符 CONSTANT NameAndType 
index u2 i 
的 索引 项 


ET 


指向 声明 方法 的 类 描述 符 CONSTANT 
CONSTANT Methodref index U2 辣 让 站 描述 符 
和 > Class_info 的 索引 项 
nio 
i 指向 名 称 及 类 型 描述 符 CONSTANT_ 
index u 
NameAndType 的 索引 项 
CONSTANT Interface-| 和 指向 声明 方法 的 接口 描述 符 CONSTANT_ 
Methodref info A - Class_info 的 索引 项 
指向 名 称 及 类 型 描述 符 CONSTANT_ 
index u2 
NameAndType 的 索引 项 


常 量 描 述 
值 为 12 
指向 该 字段 或 方法 名 称 常量 项 的 索引 
指向 该 字段 或 方法 描述 符 常 量 项 的 索引 
值 为 15 
值 必须 在 1 一 9 之 间 (包括 1 和 9)， 它 
reference_kind 决定 了 方法 句柄 的 类 型 。 方 法 句柄 类 型 的 值 
表示 方法 句柄 的 字 节 码 行为 
值 必须 是 对 常量 池 的 有 效 索引 
人 | To 
CONSTANT_Method- 值 必须 是 对 常量 池 的 有 效 索引 ， 常 量 池 在 
Type_info descriptor_index u2 该 索引 处 的 项 必须 是 CONSTANT _Utfg_info 
结构 ， 表 示 方 法 的 描述 符 


| 什 为 18 


bootstrap_method attr_ 值 必须 是 对 当前 Class 文件 中 引导 方法 表 
index 的 bootstrap_methods[] 数组 的 有 效 索 引 
CONSTANT Invoke- 一 = 


值 必须 是 对 当前 常量 池 的 有 效 索 引 ， 
量 池 在 该 索引 处 的 项 必须 是 CONSTANT _ 
NameAndType_info 结构 ， 表 示 方 法 名 和 方 
法 描述 符 


CONSTANT Name- 
AndType_info 


CONSTANT_ Method- 
Handle_info 


Dynamic_info 


name and type_index u2 


6.3.3 ”访问 标志 


在 常量 池 结 束 之 后 ， 紧 接着 的 两 个 字 市 代表 访问 标志 
bi ， 这 个 标志 用 于 识别 一 些 类 或 者 接口 层次 的 访问 信 
， 包 括 : 这 个 Class 是 类 还 是 接口 ， 是 否定 义 为 public 类 型 ， 是 否定 义 
为 abstract 类 型 ;如 末 是 类 的 话 ， 有 是 否 被 声明 为 final 等 。 上 有 具体 的 标志 位 
以 及 标志 的 含义 见 表 6-7。 


表 6-7 访问 标志 


标志 名 称 标志 值 会 这 


ACC PUBLIC 0x0001 是 否 为 public 类 型 
ACC _ FINAL 0x0010 是 否 被 声明 为 fnal， 只 有 类 可 设置 
ee 了 节 码 指令 的 新 语意 ，invokespecia 
ACC _ SUPER 0x0020 指令 的 语意 在 JDK 1.0.2 发 生 过 改变 ， 为 了 区 别 这 条 指令 使 用 哪 种 
语意 ，JDK 1.0.2 之 后 编译 出 来 的 类 的 这 个 标志 都 必须 为 真 
ACC INTERFACE 0x0200 标识 这 是 一 个 接口 
RO a 是 否 为 abstract 类 型 ， 对 于 接口 或 者 抽象 类 来 说 ， 此 标志 值 为 
- 真 ， 其 他 类 值 为 候 - 


ACC SYNTHETIC 0x1000 标识 这 个 类 并 非 由 用 户 代码 产生 的 
标识 这 是 一 个 注解 


个 枚 举 


ACC ANNOTATION 
C_ENUM 


0x2000 


标识 这 是 一 


0x4000 


access_flags 中 一 共有 16 个 标志 位 可 以 使 用 ， 当 前 只 定义 了 其 中 8 个 
没有 使 用 到 的 标志 位 要 求 一 律 为 0。 以 代码 清单 6-1 中 的 代码 为 例 ， 
TestClass 是 一 个 普通 Java 类 ， 不 是 接口 、 枚 举 或 者 注解 ， 被 public 关 键 
字 修 饰 但 没有 被 声明 为 final 和 abstract， 并 且 它 使 用 了 JDK 1.2 之 后 的 编 
器 进行 编译 ， 因 此 它 的 ACC_PUBLIC、ACC_SUPER 标 志 应 当 为 真 ， 


而 ACC_FINAL、ACC_INTERFACE、ACC_ABSTRACT、 
ACC_SYNTHETIC、ACC_ANNOTATION、ACC_ENUM 这 6 个 标志 应 
当 为 假 ， 因 此 它 的 access_flags 的 值 应 为 : 0x0001|0x0020=0x0021。 从 图 
6-5 中 可 以 看 出 ，access_flags 标 志 ( 偏 移 地 址 :0x000000EF) 的 确 为 
0x0021。 


06 01 00 OA 53 6F 75 72 6 46 01 00 ....SourceFile,. 
000000E0 | 0E 54 65 73 74 43 6C 61 2 61 WU | .TestClass. javeE 


000000F0 ‘1 00 01 00 03 00 00 00 
00000100 |00 00 02 00 01 00 07 O00 


图 6-5 access_flags 标 志 
[1] 在 Java 虚 拟 机 规范 中 ， 只 定义 了 开头 5 种 标志 。JDK 1.5 中 增加 了 后 面 
3 种 。 这 些 标志 为 在 JSR-202 规 范 中 声明 ， 是 对 《Java 虚 拟 机 规范 (第 2 
版 ) 》 的 补充 。 本 书 介绍 的 访问 标志 以 JSR-202 规 范 为 准 。 


6.3.4 类 索引 、 父 类 索引 与 接口 索引 集合 


类 索引 (this_class) 和 父 类 索引 (super_class) 都 是 一 个 u2 类 型 的 
数据 ， 而 接口 索引 集合 (interfaces) 是 一 组 u2 类 型 的 数据 的 集合 ， 
Class 文 件 中 由 这 三 项 数据 来 确定 这 个 类 的 继承 关系。 类 索引 用 于 确定 
这 个 类 的 全 限定 名 ， 父 类 索引 用 于 确定 这 个 类 的 父 类 的 全 限定 名 。 由 
于 Java 语 言 不 允许 多 重 继承 ， 所 以 父 类 索引 只 有 一 个 ， 除 了 
java.lang.Object 之 外 ， 所 有 的 Java 类 都 有 父 类 ， 因 此 除了 java.lang.Object 
外 ， 所 有 Java 类 的 父 类 索引 都 不 为 0。 接 口 索 引 集合 束 用 来 描述 这 个 类 
实现 了 哪些 接口 ， 这 些 被 实现 的 接口 将 按 implements 语 句 (如 果 这 个 类 
本 身 是 一 个 接口 ， 则 应 当 是 extends 语 句 ) 后 的 接口 顺序 从 左 到 右 排列 
在 接口 索引 集合 


类 索引 、 父 类 索引 和 接口 索引 集合 都 按 顺序 排列 在 访问 标志 之 
后 ， 类 索引 和 父 类 索引 用 两 个 u2 类 型 的 索引 值 表 示 ， 它 们 各 上 自 指向 一 
个 类 型 为 CONSTANT_Class_info 的 类 描述 符 常量 ， 通 过 
CONSTANT_Class_info 类 型 的 各 量 中 的 索引 值 可 以 找到 定义 在 
CONSTANT_Utf8_info 类 型 的 常量 中 的 全 限定 名 字符 串 。 图 6-6 演 示 了 
代码 清单 6-1 的 代码 的 类 索引 查找 过 程 。 


对 于 接口 索引 集合 ， 入 口 的 第 一 项 一 一 u2 类 型 的 数据 为 接口 计数 
器 (interfaces_count) ， 表 示 索 引 表 的 容量 。 如 果 该 类 没有 实现 任何 接 


口 ， 则 该 计数 器 值 为 0， 后 面 接口 的 索引 表 不 再 占用 任何 字 世 。 代 码 清 
单 6-1 中 的 代码 的 类 索引 、 父 类 索引 与 接口 表 索 引 的 内 容 如 图 6-7 所 示 。 


#1 EDESTANT Class_info #2 CONSTANT Utf8_ info 


index:2 length:29 


bytegs' org/fenixsoft/clarz 
/TestClass 


0D00000Dp0 |06 01 00 OA 53 6F 75 72 65-01-00| ss-SourceFiles: 
D000D00E0O |0E 54 65 73 74 43 6C 61 76 61 00 .TestClass,]java. 
D00000F0 | 21 0D001u00.0300 0 回 00 00 06 00 
00000100 00 00 02 00 01 00 07 00 00 00 00 


图 6-7 类 索引 、 父 类 索引 、 接 口 索引 集合 


从 偏 移 地 址 0x000000F1 开 始 的 3 个 u2 类 型 的 值 分 别 为 0x0001、 
0x0003、0x0000， 也 就 是 类 索引 为 1， 父 类 索引 为 3， 接 口 索引 集合 
小 为 0， 查 询 前 面 代码 清单 6-2 中 javap 命 令 计算 出 来 的 常量 池 ， 找 出 对 
应 的 类 和 父 类 的 和 常量， 结果 如 代码 清单 6-3 所 示 。 


代码 清单 6-3 ”部 分 冲 量 池内 容 


const#1=class#2; //org/fenixsoft/clazz/TestClass 
const#2=Asciz org/fenixsoft/clazz/TestClass:; 
const#3=class#4; //java/lang/Object 
const#4=Asciz java/lang/0Object; 


6.3.5 “字段 表 集 合 


字段 表 (field_info) 用 于 描述 接口 或 者 类 中 声明 的 变量 。 字 段 
(field) 包括 类 级 变量 以 及 实例 级 变量 ， 但 不 包括 在 方法 内 部 声明 的 局 
部 变量 。 我 们 可 以 想 一 想 在 Java 中 摘 述 一 个 字段 可 以 包含 什么 信息 ? 可 
以 包括 的 信息 有 : 字段 的 作用 域 (public、private、protected 修 饰 
符 ) 、 是 实例 变量 还 是 类 变量 (static 修 饰 符 ) 、 可 变性 (final) 、 并 
发 可 见 性 (volatile 修 饰 符 ， 是 否 强 制 从 主 内 存 读 写 ) 、 可 否 被 序列 化 
(transient 修 饰 符 ) 、 字 段 数据 类 型 (基本 类 型 、 对 象 、 数 组 ) 、 字 段 
名 称 。 上 述 这 些 信息 中 ， 各 个 修饰 符 都 古 布 尔 值 ， 要 么 有 某 个 修饰 

， 要 么 没有 ， 很 适合 使 用 标志 位 来 表示 。 而 字段 叫 什么 名 子 、 了 字段 
被 定义 为 什么 数据 类 型 ， 这 些 痢 十 无 法 固定 的 ， 只 能 引用 肖 量 池 中 的 


常量 来 揪 述 。 表 6-8 中 列 出 了 字段 表 的 最 终 格式 。 


attributes count 


attribute info | attributes | attributes count 


字段 修饰 符 放 在 access_flags 项 目 中 ， 它 与 类 中 的 access_flags 项 目 
是 非常 类 似 的， 都 是 一 个 u2 的 数据 类 型 ， 其 中 可 以 设置 的 标志 位 和 伟 
见 表 6-9。 


表 6-9 字段 访问 标志 


标志 名 称 标志 值 含 义 
ACC PUBLIC 0x0001 字段 是 否 public 
ACC PRIVATE 0x0002 字段 是 否 private 
ACC PROTECTED 0x0004 字段 是 否 protected 
ACC STATIC 0x0008 字段 是 否 static 
ACC FINAL 0x0010 字段 是 否 final 
ACC _ VOLATILE 0x0040 字段 是 否 volatile 
ACC TRANSIENT 0x0080 字段 是 否 transient 
ACC SYNTHETIC 0x1000 字段 是 否 由 编译 顺 自 动产 生 的 
ACC_ENUM 0x4000 字段 是 否 enum 


很 明显 ， 在 实际 情况 中 ，ACC_PUBLIC、ACC_PRIVATE、 
ACC_PROTECTED 三 个 标志 最 多 只 能 选择 其 一 ，ACC_FINAL、 
ACC_VOLATIILE 不 能 同时 选择 。 接 口 之 中 的 字段 必须 有 
ACC_PUBLIC、ACC_STATIC、ACC_FINAL 标 志 ， 这 些 都 是 由 Java 本 
身 的 语言 规则 所 决定 的 。 


跟随 access_flags 标 志 的 是 两 项 索引 值 : name_index 和 
descriptor_index。 它 们 都 古 对 常量 池 的 引用 ,分别 代表 着 字段 的 简单 名 
称 以 及 字段 和 方法 的 描述 符 。 现 在 需要 解释 一 下 “简单 名 称 *>、“ 描 述 
符 ” 以 及 前 面 出 现 过 多 次 的 “全 限定 名 ”这 三 种 特殊 字符 串 的 概念 。 


全 限定 名 和 简单 名 称 很 好 理解 ， 以 代码 清单 6-1 中 的 代码 为 
例 ，"org/fenixsoftclazz/TestClass" 是 这 个 类 的 全 限定 名 ， 仅 仅 是 把 类 全 
名 中 的 “.” 警 换 成 了 “而 已 ， 为 了 使 连续 的 多 个 全 限定 名 之 间 不 产生 混 
消 ， 在 使 用 时 最 后 一 般 会 加 入 一 个 “; ?和 霄 示人 全 限定 名 结束 。 简 单 名 称 


苹 指 没有 类 型 和 参数 修饰 的 方法 或 者 字段 名 称 ， 这 个 类 中 的 inc0) 方 法 


和 m 了 字段 的 简单 名 称 分别 是 "inc" 和 "m"。 


相对 于 全 限定 名 和 简单 名 称 来 说 ， 方 法 和 字段 的 描述 符 就 要 复杂 
一 些 。 描 述 符 的 作用 是 用 来 描述 字段 的 数据 类 型 、 方 法 的 参数 列表 
(包括 数量 、 类 型 以 及 顺序 ) 和 返回 值 。 根 据 描述 符 规则 ， 基 本 数据 
类 型 (byte、char、double、float、int、long、short、boolean) 以 及 代 
表 无 返回 值 的 void 类 型 都 用 一 个 大 写字 符 来 表示 ， 而 对 象 类 型 则 用 字符 
L 加 对 象 的 全 限定 名 来 表示 ， 详 见 表 6-10。 


表 6-10 ”描述 符 标 识字 符 含义 


标识 字符 2 义 标识 字符 含 义 
B 到 byte J 基本 类 型 long 
E Wy char S 基本 类 型 short 
D y double yt 基本 类 型 boolean 
F 到 float A 特殊 类 型 void 
I 到 int L 对 象 类 型 ， 如 Lijava/lang/Object 


[1] 


对 于 数组 类 型 ， 每 一 维度 将 使 用 一 个 前 置 的 “字符 来 描述 ， 如 一 
个 定义 为 "javalang.String[][]" 类 型 的 二 维 数组 ， 将 被 记录 为 : " 
[[Ljava/lang/String; "， 一 个 整 型 数组 "int[]" 将 被 记录 为 "[I"。 


用 描述 符 来 描述 方法 时 ， 按 照 移 参数 列表 ， 后 返回 值 的 顺序 描 
述 ， 参 数列 表 按 照 参数 的 严格 顺序 放 在 一 组 小 括号 “0 之 内 。 如 方法 
void inc() 的 摘 述 符 为 "()V"， 方 法 java.lang.String toStringO0 的 描述 符 为 " 


QOLjava/lang/String; "， 方 法 int indexOf (char[]source,int sourceOffset,int 
sourceCount,charl jtarget,int targetOffset,int targetCount,int fromIndex) 的 


描述 符 为 " ([CII[CIII) I"。 


对 于 代码 清单 6-1 中 的 TestClass.class 文 件 来 说 ， 字 段 表 集合 从 地 址 
0x000000F8 开 始 ， 第 一 个 u2 类 型 的 数据 为 容量 计数 器 fields_count， 如 
图 6-8 所 示 ， 其 值 为 0x0001， 说 明 这 个 类 只 有 一 个 字段 表 数 据 。 接 下 来 
紧 跟 着 容量 计数 器 的 是 access_flags 标 志 ， 值 为 0x0002， 代 表 private 修 饰 
符 的 ACC_PRIVATE 标 志 位 为 真 (ACC_PRIVATE 标 志 的 值 为 
0x0002) ， 其 他 修饰 符 为 假 。 代 表 字 段 名 称 的 name_index 的 值 为 
0x0005， 从 代码 清单 6-2 列 出 的 背 量 表 中 可 查 得 第 5 项 常量 是 一 个 
CONSTANT_Utf8_info 类 型 的 字符 串 ， 其 值 为 "m"， 代 表 字 上 段 换 述 符 的 
descriptor_index 的 值 为 0x0006， 指 问 常 量 池 的 字符 串 "I"， 根 据 这 些 信 
息 ， 我 们 可 以 推断 出 原 代 码 定义 的 字段 为 : "private intm; "。 


字段 表 都 包含 的 固定 数据 项 目 到 descriptor_index 为 止 就 结束 了 ， 不 
过 在 descriptor_index 之 后 跟随 着 一 个 属性 表 集 合用 于 存储 一 些 额外 的 信 
息 ， 字 段 都 可 以 在 属性 表 中 搬 述 零 至 多 项 的 额外 信息 。 对 于 本 例 中 的 
字段 m， 它 的 属性 表 计 数 器 为 0， 也 就 是 没有 需要 额外 描述 的 信息 ， 但 
是 ， 如 果 将 字段 m 的 声明 改 为 "final static int m=123; "， 那 就 可 能 会 存 
在 一 项 名 称 为 ConstantValue 的 属性 ， 其 值 指 癌 常 量 123。 天 于 


attribute_info 的 其 他 内 容 ， 将 在 6.3.7 节 介绍 属性 表 的 数据 项 目 时 再 进 一 
步 讲解 。 
000000DD |06 01 00 0A 53 6F 75 72 63 65 46 69 6C 65 01 00  .,,.SourceFile,， 


000000E0D |0E S4 65 73 74 43 6C 61 73 73 2E 6A 61 76 61 00 | .IJestClass -javVa . 


000000F0 |21 00 01 00 03 00 00 [G0 ol00 02 00 06 00 | 


fields count 


00000100 |00 00 02 00 01 00 07 00 da 汪汪 > 00 
name index 


图 6-8 字段 表 结构 实例 


字段 表 集 合 中 不 会 列 出 从 超 类 或 者 父 接口 中 继承 而 来 的 字段 ， 但 
有 可 能 列 出 原本 Java 代 码 之 中 不 存在 的 字段 ， 壁 如 在 内 部 类 中 为 了 保持 
对 外 部 类 的 访问 性 ， 会 目 动 添加 指向 外 部 类 实例 的 字段 。 男 外 ， 在 Java 
语言 中 字段 是 无 法 重 载 的 ， 两 个 字段 的 数据 类 型 、 修 饰 符 不 管 是 否 相 
同 ， 都 必须 使 用 不 一 样 的 名 称 ， 但 是 对 于 字 节 码 来 讲 ， 如 果 两 个 字段 
的 搞 述 符 不 一 致 ， 那 字段 重 名 束 是 合法 的 。 


[1]void 类 型 在 虚拟 机 规范 之 中 单独 列 出 为 "VoidDescriptor"， 笔 者 为 了 结 
构 统 一 ， 将 其 列 在 基本 数据 类 型 中 一 起 描述 。 


6.3.6 方法 肪 集合 


如 果 理 解 了 上 一 下 天 于 字段 表 的 内 容 ， 那 本 节 关 于 方法 表 的 内 容 
将 会 变 得 很 向 单 。Class 文 件 存储 格式 中 对 方法 的 描述 与 对 字段 的 描述 
几乎 采用 了 完全 一 致 的 方式 ， 方 法 表 的 结构 如 同 字 段 表 一 样 ， 依 次 包 
括 了 访问 标志 (access_flags) 、 名 称 索 引 (name_index) 、 描 述 符 索 引 

(descriptor_index) 、 属 性 表 集 合 (attributes) 几 项 ， 见 表 6-11。 这 些 
数据 项 目的 含义 也 非常 类 似 ， 仅 在 访问 标志 和 属性 表 集 合 的 可 选项 中 
有 所 区 别 。 


表 6-11 方法 表 结 构 


数 


一 
时 


u2 | access flags | attributes_count 1 


| name index attribute info | attributes attributes count 


descriptor_index 


因为 volatile 天 键 字 和 transient 天 键 字 不 能 修饰 方法 ， 所 以 方法 表 的 
访问 标志 中 没有 了 ACC_VOLATILE 标 志和 ACC_TRANSIENT 标 志 。 
之 相对 的 ，synchronized、native、strictftp 和 abstract 关 键 字 可 以 修饰 方 
法 ， 所 以 方法 表 的 访问 标志 中 增加 了 ACC_SYNCHRONIZED 、 
ACC_NATIVE、ACC_STRICTFP 和 ACC_ABSTRACT 标 志 。 对 于 方法 
表 ， 所 有 标志 位 及 其 取 值 可 参见 表 6-12 。 


表 6-12 方法 访问 标志 


标志 名 称 标志 值 含 义 
ACC PUBLIC 0x0001 方法 是 否 为 public 
ACC PRIVATE 0x0002 方法 是 否 为 private 
ACC PROTECTED 0x0004 方法 是 否 为 protected 
ACC_STATIC Ox0008 方法 是 否 为 static 
ACC FINAL 0x0010 方法 是 否 为 final 
ACC_ SYNCHRONIZED 0x0020 方法 是 否 为 synchronized 
ACC BRIDGE 0x0040 方法 是 否 是 由 编译 器 产生 的 桥接 方法 
ACC VARARGS 0x0080 方法 是 否 接受 不 定 参 数 
ACC_NATIVE 0x0100 方法 是 否 为 native 
ACC ABSTRACT 0x0400 方法 是 否 为 abstract 
ACC STRICTFP 0x0800 方法 是 否 为 strictfp 
ACC_SYNTHETIC 0x1000 方法 是 否 是 由 编译 器 自动 产生 的 


行文 至 此 ， 也 许 有 的 读者 会 产生 疑问 ， 方 法 的 定义 可 以 通过 访问 
标志 、 名 称 索 引 、 摘 述 符 系 引 表达 清楚 ， 但 方法 里 面 的 代码 去 哪里 
了 ? 方法 里 的 Java 代 码 ， 经 过 编译 项 编 译 成 字 节 码 指令 后 ， 存 放 在 方法 
属性 表 集 合 中 一 个 名 为 "Code" 的 属性 里 面 ， 属 性 表 作 为 Class 文 件 格式 
中 最 具 扩 展 性 的 一 种 数据 项 目 ， 将 在 6.3.7 节 中 详细 讲解 。 


我 们 继续 以 代码 清单 6-1 中 的 Class 文 件 为 例 对 方法 表 集 合 进行 分 
析 ， 如 图 6-9 所 示 ， 方 法 表 集 合 的 入 口 地 址 为 : 0x00000101， 第 一 个 u2 
类 型 的 数据 〈 即 是 计数 器 容量 ) 的 值 为 0x0002， 代 表 集 合 中 有 两 个 方 
法 (这 两 个 方法 为 编译 器 添加 的 实例 构造 器 <init> 和 源码 中 的 方法 
inc()) 。 第 一 个 方法 的 访问 标志 值 为 0x001， 也 就 是 只 有 ACC_PUBLIC 
标志 为 真 ， 名 称 索 引 值 为 0x0007， 查 代码 清单 6-2 的 常量 池 得 方法 名 
为 "<init>"， 描 述 符 索 引 值 为 0x0008， 对 应 常量 为 "0V"， 属 性 表 计 数 


右 attributes_count 的 值 为 0x0001 就 表示 此 方法 的 属性 表 集 合 有 一 项 属 
性 ， 属 性 名 称 索 引 为 0x0009， 对 应 第 量 为 "Code"， 说 明 此 属性 是 方法 


的 字 节 码 描述 。 


DO0D0D00FD ,21 00 01 00 03 00 00 00 01 00 02 00 05 00 06 00  ! 


00000100 00 [0 02l00 oo olo0 volo oo a oo0 00 00 


00000110 | 2F 00fo1 a 00fo0 ee 2 人 87 oi” B1 00 00 | /~ 
《hods_cownt nane_indox httributes count 


melhod 


图 6-9 方法 表 结构 实例 


与 字段 表 和 集合 相对 应 的 ， 如 琳 父 类 方法 在 于 类 中 没有 人 被 重 写 
(Override) ， 方 法 表 和 集合 中 就 不 会 出 现 来 自 父 类 的 方法 信息 。 但 同样 
的 ， 有 可 能 会 出 现 由 编译 表 目 动 添 加 的 方法 ， 最 典型 的 便 十 类 构造 


器 "< clinit> "方法 和 实例 构造 器 "<init> "方法 。 


在 Java 语 言 中 ， 要 重 载 (Overload) 一 个 方法 ， 除 了 要 与 原 方法 具 
有 相同 的 简单 名 称 之 外 ， 还 要 求 必 须 拥 有 一 个 与 原 方法 不 同 的 特征 从 
名 喇 ， 竺 征 签名 就 是 一 个 方法 中 各 个 参数 在 常量 池 中 的 字段 符号 引用 的 
集合 ， 也 残 是 因为 返回 值 不 会 包含 在 特征 签名 中 ， 因 此 Java 语 言 里 面 旦 
无 法 仅仅 依靠 返回 值 的 不 同 来 对 一 个 已 有 方法 进行 重 载 的 。 但 是 在 
Class 文 件 格式 中 ， 等 征 签名 的 范围 更 大 一 些 ， 只 要 摘 述 符 不 是 完全 一 
致 的 两 个 方法 也 可 以 共存 。 也 就 是 说 ， 如 果 两 个 方法 有 相同 的 名 称 和 


等 征 等 名 ， 但 返回 值 不 同 ， 那 么 也 是 可 以 合法 共存 于 同一 个 Class 文 件 
Hs 


[1]<init> 和 < dlinit> 的 详细 内 容 见 本 书 的 第 10 章 。 

[2] 在 《Java 虚 拟 机 规范 (第 2 版 )》 的 "84.4.4 Signatures" 章 节 及 《Java 
语言 规范 (第 3 版 )》 的 "88.4.2 Method Signature" 章 节 中 都 分 别 定 义 了 
字 节 码 层面 的 方法 特征 签名 以 及 Java 代 码 层面 的 方法 特征 签名 ，jJava 代 
码 的 方法 特征 签名 只 包括 了 方法 名 称 、 参 数 顺 序 及 参数 类 型 ， 而 字 节 
码 的 特征 签名 还 包括 方法 返回 值 以 及 受 查 异常 表 ， 请 读者 根据 上 下 文 


语 境 注意 区 分 。 


6.3.7 属性 表 和 集合 


属性 表 (attribute_info) 在 前 面 的 讲解 之 中 已 经 出 现 过 数 次 ， 在 
Class 文 件 、 字 段 表 、 方 法 表 痢 可 以 携 市 目 己 的 属性 表 和 集合 ， 以 用 于 摘 
述 某 些 场景 专 有 的 信息 。 


与 Class 文 件 中 其 他 的 数据 项 目 要 求 严 格 的 顺序 、 长 度 和 内 容 不 
同 ， 属 性 表 集 合 的 限制 稍微 宽松 了 一 些 ， 不 再 要 求 各 个 属性 表 具 有 严 
格 顺序 ， 并 且 只 要 不 与 已 有 属性 名 重复 ， 任 何人 实现 的 编译 器 都 可 以 
向 属性 表 中 写 入 自己 定义 的 属性 信息 ，Java 虚 拟 机 运行 时 会 忽略 掉 它 不 
认识 的 属性 。 为 了 能 正确 解析 Class 文 件 ，《Java 虚 拟 机 规范 (第 2 
版 ) 》 中 预定 义 了 9 项 虚拟 机 实现 应 当 能 识别 的 属性 ， 而 在 最 新 的 
《Java 虚 拟 机 规范 (Java SE 7) 》 版 中 ， 预 定义 属性 已 经 增加 到 21 项 ， 
具体 内 容 见 表 6-13。 下 文中 将 对 其 中 一 些 属性 中 的 关键 常用 的 部 分 进行 
讲解 。 


表 6-13 ”虚拟 机 规范 预定 义 的 属性 


属性 名 称 使 用 位 置 含 
Code 方法 表 Java 代码 编译 成 的 字 节 码 指令 
ConstantValue 字段 表 final 关键 字 定 义 的 常量 值 
Deprecated 类 、 方 法 表 、 字 段 表 被 声明 为 deprecated 的 方法 和 字段 
Exceptions 方法 表 方法 抛 出 的 异常 
pe 类 文件 仅 当 一 个 类 为 局 部 类 或 者 品 名 类 本 才能 拥有 这 个 属 
到 性 ， 这 个 属性 用 于 标识 这 个 类 所 在 的 外 围 方 法 


CTT CE 
InnerClasses 内 部 类 列表 
LineNumberTable Java 源码 的 行 号 与 字 节 码 指令 的 对 应 关系 
LocalVariableTable 方法 的 局 部 变量 描述 


JDK 1.6 中 新 增 的 属性 ， 供 新 的 类 型 检查 验证 器 
StackMapTable Code 局 性 (Type Checker) 检查 和 人 处 理 目标 方法 的 局 部 变量 和 操 
作 数 栈 所 需要 的 类 型 是 否 匹 配 


JDK 1.5 中 新 增 的 属性 ， 这 个 属性 用 于 支持 泛 型 
情况 下 的 方法 签名 ， 在 Java 语言 中 ， 任 何 类 、 接 
口 、 初 始 化 方法 或 成 员 的 汉 型 签名 如 果 包 含 了 类 型 
变量 《Type Variables) 或 参数 化 类 型 (Parameterized 
Types)， 则 Signature 属性 会 为 它 记 录 泛 型 等 名 信息 。 
由 于 Java 的 泛 型 采用 所 除法 实现 ， 在 为 了 避免 类 型 
信息 被 擦 除 后 导致 签名 混乱 ， 需 要 这 个 属性 记录 泛 型 
中 的 相关 信息 
SourceFile 记录 源 文 件 名 称 

JDK 1.6 中 新 增 的 属性 ，SourceDebugExtension 属 
性 用 于 存储 额外 的 调试 信息 。 璧 如 在 进行 JSP 文件 调 
试 时 ， 无 法 通过 Java 堆栈 来 定位 到 JSP 文 件 的 行 号 ， 


Signature 类 、 方 法 表 、 字 段 表 


SourceDebugExtension JSR-45 规范 为 这 些 非 Java 语 言 编 写 ， 却 需要 编译 成 
字 节 码 并 运行 在 Java 虚拟 机 中 的 程序 提供 了 一 个 进 
行 调试 的 标准 机 制 ， 使 用 SourceDebugExtension 属性 
就 可 以 用 于 存储 这 个 标准 所 新 加 入 的 调试 信息 
Synthetic 标识 方法 或 字段 为 编译 器 自动 生成 的 


JDK 1.5 中 新 增 的 属性 ， 它 使 用 特征 签名 代替 描述 
符 ， 是 为 了 引入 泛 型 语法 之 后 能 描述 证 型 参数 化 类 型 
而 旋 加 

JDK 1.5 中 新 增 的 属性 ， 为 动态 注解 提供 支持 。 
RuntimeVisibleAnnotations 届 性 用 于 指明 哪些 注 
解 基 运行 时 (实际 上 运行 时 就 是 进行 反射 调用 ) 可 
见 的 

JDK 1.5 中 新 增 的 属性 ， 与 RuntimeVisibleAnnotations 
RuntimelInvisibleAnnotations 类 、 方 法 表 、 字 有 段 表 属性 作用 刚好 相反 ， 用 于 指明 哪些 注解 是 运行 时 不 可 
见 的 


RuntimeVisibleParameter JDK 15 中 新 增 的 属性 ， 作 用 与 RuntimeVisibleAnnotations 
Annotations 属性 类 似 ， 只 不 过 作用 对 象 为 方法 参数 
RuntimelInvisibleParameter JDK 1.5 中 新 增 的 属性 ， 作 用 与 RuntimelInvisible- 
Annotations Annotations 属性 类 似 ， 只 不 过 作用 对 象 为 方法 参数 


i 1.5 中 新 增 的 属性 ， 用 于 记录 注解 类 元 素 的 默 


LocalVariableType Table 


RuntimeVisibleAnnotations 


AnnotationDefault 方法 表 


长 
BootstrapMethods 类 文件 上 ee 人 
如 


对 于 每 个 属性 ， 它 的 名 称 需 要 从 常量 池 中 引用 一 个 
CONSTANT_Utf8_info 类 型 的 稼 量 来 表示 ， 而 属性 值 的 结构 则 是 完全 目 
定义 的 ， 只 需要 通过 一 个 u4 的 长 度 属性 去 说 明 属 性 值 所 占用 的 位 数 即 
可 。 一 个 符合 规则 的 属性 表 应 该 满足 表 6-14 中 所 定义 的 结构 。 


表 6-14 属性 表 结构 


u4 attribute_ length 1 


ul info attribute length 


1.Code 属 性 


Java 程 序 方法 体 中 的 代码 经 过 Javac 编 译 器 处 理 后 ， 最 终 变 为 字 节 
码 指 令 存 储 在 Code 属 性 内 。Code 属 性 出 现在 方法 表 的 属性 集合 之 中 ， 
但 并 非 所 有 的 方法 表 都 必须 存在 这 个 属性 ， 壁 如 接口 或 者 抽象 类 中 的 
方法 下 不 存在 Code 属 性 ， 如 来 方法 表 有 Code 属 性 存在 ， 那 么 它 的 结构 
将 如 表 6-15 所 示 。 


表 6-15 Code 属性 表 的 结构 


类 型 名 称 数 量 
u2 attribute name index 1 
u4 attribute length 1 
u2 max stack 1 
u2 max locals 1 
u4 code length 1 
ul code code length 
u2 exception table length 1 
exception_ info exception table exception table_ length 
u2 attributes count 1 
attribute info attributes attributes count 


attribute_name_index 是 一 项 指向 CONSTANT_Utf8_info 型 常量 的 索 
引 ， 常 量 值 固定 为 "Code"， 它 代表 了 该 属性 的 属性 名 称 ， 
attribute_length 指 示 了 属性 值 的 长 度 ， 由 于 属性 名 称 索 引 与 属性 长 度 一 
共 为 6 字 节 ， 所 以 属性 值 的 长 度 固 定 为 整个 属性 表 长 度 减 去 6 个 字 。 


max_stack 代 表 了 操作 数 栈 (Operand Stacks) 深度 的 最 大 值 。 在 方 
法 执行 的 任意 时 刻 ， 操 作 数 栈 都 不 会 超过 这 个 深度 。 虚 拟 机 运行 的 时 
候 需 要 根据 这 个 值 来 分 配 栈 帧 《Stack Frame) 中 的 操作 栈 深 度 。 


max_locals 代 表 了 局 部 变量 表 所 需 的 存储 空间 。 在 这 里 ， 
max_locals 的 单位 是 Slot,Slot 是 虚拟 机 为 局 部 变量 分 配 内 存 所 使 用 的 最 
小 单位 。 对 于 byte、char、float、int、short、boolean 和 returnAddress 等 
长 度 不 超过 32 位 的 数据 类 型 ， 每 个 局 部 变量 占用 1 个 Slot， 而 double 和 
long 这 两 种 64 位 的 数据 类 型 则 需要 两 个 Slot 来 存放 “。 方 法 参数 (包括 实 
例 方法 中 的 隐藏 参数 "this") 、 显 式 异 常 处 理 器 的 参数 (Exception 


Handler Parameter， 就 是 try-catch 语 句 中 catch 块 所 定义 的 异常 )、 方 法 
体 中 定义 的 局 部 变量 都 需要 使 用 局 部 变量 表 来 存放 。 男 外 ， 并 不 是 在 
方法 中 用 到 了 多 少 个 局 部 变量 ， 就 把 这 些 局 部 变量 所 占 Slot 之 和 作为 
max_locals 的 值 ， 原 因 是 局 部 变量 表 中 的 Slot 可 以 重用 ， 当 代码 执行 超 
出 一 个 局 部 变量 的 作用 域 时 ， 这 个 局 部 变量 所 占 的 Slot 可 以 被 其 他 局 部 
变量 所 使 用 ，Javac 编 译 侣 会 根据 变量 的 作用 域 来 分 配 Slot 给 各 个 变量 使 
用 ， 然 后 计算 出 max_locals 的 大 小 。 


code_length 和 code 用 来 存储 Java 源 程序 编译 后 生成 的 字 刷 码 指令 。 
code_length 代 表 字 贡 码 长 度 ，code 是 用 于 存储 字 节 码 指令 的 一 系列 字 闻 
流 。 既 然 叫 字 闻 码 指令 ， 那 么 每 个 指令 就 是 一 个 u1 类 型 的 单字 节 ， 当 
虚拟 机 读 取 到 code 中 的 一 个 字 节 码 时 ， 就 可 以 对 应 找 出 这 个 字 节 码 代 
表 的 是 什么 指令 ， 并 且 可 以 知道 这 条 指令 后 面 是 否 需要 跟随 参数 ， 以 
及 参数 应 当 如 何 理解 。 我 们 知道 一 个 ul 数据 类 型 的 取 值 范围 为 
0x00~0xFF， 对 应 十 进 制 的 0~255， 也 就 是 一 共 可 以 表达 256 条 指令 ， 目 
前 ，Java 虚 拟 机 规范 已 经 定义 了 其 中 约 200 条 编码 值 对 应 的 指令 含义 ， 
编码 与 指令 之 间 的 对 应 关系 可 查阅 本 书 的 附录 B“ 虚 拟 机 字 节 码 指令 
表 ”。 


关于 code_length， 有 一 件 值 得 注意 的 事情 ， 虽 然 它 是 一 个 u4 类 型 
的 长 度 值 ， 理 论 上 最 大 值 可 以 达到 232-1， 但 是 虚拟 机 规范 中 明确 限制 
了 一 个 方法 不 允许 超过 65535 条 字 节 码 指令 ， 即 它 实际 只 使 用 了 u2 的 长 


度 ， 如 果 超 过 这 个 限制 ，Javac 编 译 絮 也 会 拒绝 编译 。 一 般 来 讲 ， 编 写 

Java 代 码 时 只 要 不 是 刻意 去 编写 一 个 超 长 的 方法 来 为 难 编译 器 ， 是 不 太 
可 能 超过 这 个 最 大 值 的 限制 。 但 是 ， 某 些 特殊 情况 ， 例 如 在 编译 一 个 

很 复杂 的 JSP 文 件 时 ， 某 些 JSP 编 译 絮 会 把 JSP 内 容 和 页 面 输出 的 信息 归 
并 于 一 个 方法 之 中 ， 束 可 能 因为 方法 生成 字 节 码 超 长 的 原因 而 导致 编 

译 失 败 。 


Code 属 性 是 Class 文 件 中 最 重要 的 一 个 属性 ， 如 果 把 一 个 Java 程 序 

中 的 信息 分 为 代码 (Code， 方 法 体 里 面 的 Java 代 码 ) 和 元 数据 

(Metadata， 包 括 类 、 字 段 、 方 法 定义 及 其 他 信息 ) 两 部 分 ， 那 么 在 整 
个 Class 文 件 中 ，Code 属 性 用 于 接 述 代码 ， 所 有 的 其 他 数据 项 目 都 用 于 
描述 元 数据 。 了 解 Code 属 性 是 学 习 后 面 关 于 字 节 码 执行 引擎 内 容 的 必 
要 基础 ， 能 直接 阅读 字 市 码 也 十 工作 中 分 析 Java 代 码 语 义 问题 的 必要 工 
上 共和 基本 技能 ， 因 此 笔 关 准备 了 一 个 比较 详细 的 实例 来 讲解 虚拟 机 是 
如 何 使 用 这 个 属性 的 。 


继续 以 代码 清单 6-1 的 TestClass.class 文 件 为 例 ， 如 图 6-10 所 示 ， 这 
是 上 一 节 分 析 过 的 实例 构造 器 "< init > "方法 的 Code 属 性 。 它 的 操作 数 
栈 的 最 大 深度 和 本 地 变量 表 的 容量 都 为 0x0001， 字 节 码 区 域 所 占 空间 
的 长 度 为 0x0005。 虚 拟 机 读 取 到 字 节 码 区 域 的 长 度 后 ， 按 照 顺序 依次 
读 入 紧 随 的 5 个 字 节 ， 并 根据 字 节 码 指令 表 翻 译 出 所 对 应 的 字 节 码 指 
令 。 翻 译 "2A B7 00 0A B1" 的 过 程 为 : 


1) 读 入 2A， 查 表 得 0x2A 对 应 的 指令 为 aload_0， 这 个 指令 的 含义 
是 将 第 0 个 Slot 中 为 reference 类 型 的 本 地 变量 推送 到 操作 数 栈 顶 。 


2) 读 入 B7， 碍 表 得 0xB7 对 应 的 指令 为 invokespecial， 这 条 指令 的 
作用 是 以 栈 顶 的 reference 类 型 的 数据 所 指向 的 对 象 作为 方法 接收 者 ， 调 
用 此 对 象 的 实例 构造 器 方法 、private 方 法 或 者 它 的 父 类 的 方法 。 这 个 方 
法 有 一 个 u2 类 型 的 参数 说 明 具 体 调 用 哪 一 个 方法 ， 它 指向 常量 池 中 的 
一 个 CONSTANT_Methodref_ info 类 型 常量 ， 即 此 方法 的 方法 符号 引 
用 o 


3) 读 入 00 0A， 这 是 invokespecial 的 参数 ， 查 常量 池 得 0x000A 对 应 
的 常量 为 实例 构造 器 "<init> "方法 的 符号 引用 。 


4) 读 入 B1， 查 表 得 0xB1 对 应 的 指令 为 return， 含 义 是 返回 此 方 
法 ， 并 且 返 回 值 为 void 。 这 条 指令 执行 后 ， 当 前 方法 结 
1 DOOT 004 O07 O00 O00 OL OO 02 O00 03 000.06-00. | iis 


00 00 02 00 01 00 07 00 08 00 01 00 09 00 00 00 


2F (00 oll00 ol00 00 00 ola B7 00 Oa Bl oo 00 / 


code _ length 


max stuck 


00000120 |00 0<400 和 00 004o6 00 01 004#00 00 03 00 0D 


图 6-10 Code 属性 结构 实例 


这 段子 节 码 虽然 很 短 ， 但 是 至 少 可 以 看 出 它 的 执行 过 程 中 的 数据 
交换 、 方 法 调用 等 操作 都 是 基于 栈 (操作 栈 ) 的 。 我 们 可 以 初步 猜 


测 : Java 虚 拟 机 执行 字 节 码 是 基于 栈 的 体系 结构 。 但 是 与 一 般 基 于 堆栈 
的 零 字 市 指令 又 不 太一 样 ， 某 些 指 令 (如 invokespecial) 后 面 还 会 带 有 
参数 ， 关 于 虚拟 机 字 市 码 执 行 的 讲解 古 后 面 两 草 的 重点 ， 我 们 不 妨 把 
这 里 的 疑问 放 到 第 8 章 去 解决 。 


S 


我 们 再 次 使 用 javap 命 令 把 此 Class 文 件 中 的 另外 一 个 方法 的 字 闻 码 
指令 也 计算 出 来 ， 结 果 如 代码 清单 6-4 所 示 。 


代码 清单 6-4 用 javap 命 令 计 算 字 节 码 指令 


// 原 始 Java 代 码 

public class TestClasst 
private int m; 

public int inc(){ 

return m+1; 

} 

} 

C:\>javap-verbose TestClass 
// 常 量 表 部 分 的 输出 见 代 码 清 单 6-1， 因 版 面 原因 这 里 省 略 掉 


public org.fenixsoft.clazz.TestClass( ); 
Code: 

Stack=1, Locals=1, Args_size=1 

0:aload_0 

1:invokespecial#10; //Method java/lang/Object."<init>":()V 
4:return 

LineNumberTable: 

line 3:0 

LocalVvariableTable: 

Start Length Slot Name Signature 

0 5 0 this Lorg/fenixsoft/clazz/TestClass:; 
public int inc(); 

Code: 

Stack=2, Locals=1, Args_size=1 

0:aload_0 

1:getfield#18; //Field m:I 

4:iconst_1 

5:iadd 


6:ireturn 

LineNumberTable: 

line 8:0 

LocalVariableTable: 

Start Length Slot Name Signature 

0 7 © this Lorg/fenixsoft/clazz/TestClass:; 


} 


如 果 大 家 注意 到 javap 中 输出 的 "Args_size" 的 值 ， 可 能 会 有 疑问 : 
这 个 类 有 两 个 方法 一 一 实例 构造 器 <init> 0 和 incO0， 这 两 个 方法 很 明 
显 都 是 没有 参数 的 ， 为 什么 Args_size 会 为 1? 而 且 无 论 是 在 参数 列表 里 
还 是 方法 体内 ， 都 没有 定义 任何 局 部 变量 ， 那 Locals 又 为 什么 会 等 于 
1? 如 果 有 这 样 的 疑问 ， 大 家 可 能 是 忽略 了 一 点 ， 在 任何 实例 方法 里 
面 ， 都 可 以 通过 "this" 关 键 字 访问 到 此 方法 所 属 的 对 象 。 这 个 访问 机 制 
对 Java 程 序 的 编写 很 重要 ， 而 它 的 实现 却 非常 简单 ， 仅 仅 是 通过 Javac 
编译 器 编译 的 时 候 把 对 this 关 键 字 的 访问 转变 为 对 一 个 普通 方法 参数 的 
访问 ， 然 后 在 虚拟 机 调用 实例 方法 时 自动 传 入 此 参数 而 已 。 因 此 在 实 
例 方 法 的 局 部 变量 表 中 至 少 会 存在 一 个 指向 当前 对 象 实例 的 局 部 变 
量 ， 局 部 变量 表 中 也 会 预 留 出 第 一 个 Slot 位 来 存放 对 象 实例 的 引用 ， 方 
法 参数 值 从 1 开始 计算 。 这 个 处 理 只 对 实例 方法 有 效 ， 如 果 代 码 清单 6-1 
中 的 inc0) 方 法 声明 为 static， 那 Args_size 职 不 会 等 于 1 而 是 等 于 0 了 。 


在 字 节 人 码 指令 之 后 的 是 这 个 方法 的 显 式 异常 处 理 表 (下 文 简称 异 
常 表 ) 集合 ， 异 常 表 对 于 Code 属 性 来 说 并 不 是 必须 存在 的 ， 如 代码 清 
单 6-4 中 束 没 有 异常 表 生 成 。 


异常 表 的 格式 如 表 6-16 所 示 ， 它 包含 4 个 字段 ， 这 些 字 段 的 舍 义 
为 : 如果 当 字 节 人 码 在 第 start_pc 行 川 到 第 end_pc 行 之 间 〈 不 含 第 end_pc 
行 ) 出 现 了 类 型 为 catch_type 或 者 其 子 类 的 异常 (catch_type 为 指向 一 个 
CONSTANT_Class_info 型 常量 的 索引 ) ， 则 转 到 第 handler_pc 行 继续 处 
理 。 当 catch_type 的 值 为 0 时 ， 代 表 任 意 异 常情 况 都 需要 转向 到 
handler_ pc 处 进行 处 理 。 


表 6-16 属性 表 结 构 


异常 表 实 际 上 是 Java 代 码 的 一 部 分 ， 编 译 侣 使 用 异常 表 而 不 是 简单 
分 全 


代码 清单 6-5 是 一 段 演 示 异 常 表 如 何 运 作 的 例子 ， 这 上 段 代 人 码 主要 演 
示 了 在 字 节 人 码 层 面 中 try-catch-finally 是 如 何 实现 的 。 在 阅读 字 节 码 之 
前 ， 大 家 不 妨 先 看 看 下 面 的 Java 源 码 ， 想 一 下 这 上段 代码 的 返回 值 在 出 现 


异 闸 和 不 出 现 异 党 的 情况 下 分 别 应 该 是 多 少 ? 
代码 清单 6-5 异常 表 运 作 演 示 


//Java 源 码 

public int inc(){ 

int Xi; 

tryt{ 

X=1; 

return x; 

}catch (Exception e) { 


X=2; 
return x; 
}finally{ 
X=3; 


} 


} 

// 编 译 后 的 ByteCode 字 节 码 及 异常 表 

public int inc(); 

Code : 

Stack=1, Locals=5, Args_size=1 

0:iconst_1//try 块 中 的 x=1 

:ijstore 1 

:iload_1// 保 存 x 到 returnValue 中 ， 此 时 x=1 

:ijstore 4 

:iconst_3//finaly 块 中 的 x=3 

:ijstore 1 

:iload 4// 将 returnValue 中 的 值 放 到 栈 顶 ， 准 备 给 ijreturn 返 回 
9:ireturn 
10:astore_2// 给 catch 中 定义 的 Exception e 赋 值 ， 存 储 在 SLot 2 
11:iconst_2//catch 块 中 的 x=2 

12:istore 1 

13:iload_1// 保 存 x 到 returnValue 中 ， 此 时 x=2 

14:istore 4 

16:iconst_3//finaly 块 中 的 x=3 

17:istore 1 

18:iload 4// 将 returnvalue 中 的 值 放 到 栈 顶 ， 准 备 给 ireturn 返 回 
20:ireturn 
21:astore_3// 如 果 出 现 了 不 属于 java.1lang .Exception 及 其 子 类 的 异常 才 会 走 到 


~ILODOCNWN 上 


[a 
| 


22:iconst_3//finaly 块 中 的 x=3 
23:istore_1 
24:aload_3// 将 异常 放置 到 栈 顶 ， 并 抛 出 
25:athrow 

Exception table: 

from to target type 

0 5 10 Class java/lang/Exception 
0 5 21 any 

10 16 21 any 


编译 器 为 这 段 Java 源 码 生 成 了 3 条 异常 表 记 有 录 ， 对 应 3 条 可 能 出 现 的 
代码 执行 路 径 。 从 Java 代 码 的 语义 上 讲 ， 这 3 条 执行 路 径 分 别 为 : 


如 果 try 语 句 块 中 出 现 属于 Exception 或 其 了 于 类 的 异常 ， 则 转 到 catch 
语句 块 处 理 。 


如 果 try 语 句 块 中 出 现 不 属于 Exception 或 其 子 类 的 异常 ， 则 转 到 
finally 语 句 块 处 理 。 


如 琳 catch 语 句 块 中 出 现任 何 异 第 ， 则 转 到 finally 语 句 块 处 理 。 


返回 到 我 们 上 面 提出 的 问题 ， 这 段 代 码 的 运 回 值 应 该 是 多 少 ? 对 
Java 语 言 熟悉 的 读者 应 该 很 容易 说 出 答案 : 如 果 没 有 出 现 异常 ， 返 回 值 
征 1; 如 打出 现 了 Exception 异 单 ， 返 回 值 挟 2; 如 采 出 现 了 Exception 以 
外 的 异 币 ， 方 法 非 正 划 退出， 没有 返回 值 。 我 们 一 起 来 分 析 一 下 字 
码 的 执行 过 程 ， 从 字 市 码 的 层面 上 看 看 为 何 会 有 这 样 的 返回 结 


字 市 码 中 第 0~4 行 所 做 的 操作 束 古 将 整数 1 赋值 给 变量 x， 并 且 将 此 
时 x 的 值 复制 一 份 副本 到 最 后 一 个 本 地 变量 表 的 Slot 中 (这 个 Slot 里 面 的 
值 在 iretum 指 令 执 行 前 将 会 被 重新 读 到 操作 栈 顶 ， 作 为 方法 返回 值 使 
用 。 为 了 讲解 方便 ， 笔 者 给 这 个 Slot 起 了 个 名 字 : retumValue) 。 如 果 
这 时 没有 出 现 异 章 ， 则 会 继续 走 到 第 5~9 行 ， 将 变量 x 赋 值 为 9， 然后 将 
之 前 你 存在 retumValue 中 的 整数 1 读 入 到 操作 栈 硕 ， 最 后 iretum 指 令 会 以 
int 形 式 返 回 操作 栈 顶 中 的 值 ， 方 法 结束 。 如 果 出 现 了 异常 ，PC 寄 存 器 
指针 转 到 第 10 行 ， 第 10~20 行 所 做 的 事情 是 将 2 赋值 给 变量 x， 然 后 将 变 
量 x 此 时 的 值 赋 给 returmValue， 最 后 再 将 变量 x 的 值 改 为 3。 方 法 返回 前 


同样 将 returnValue 中 保留 的 整数 2 读 到 了 操作 栈 硕 。 从 第 21 行 开始 的 代 
码 ， 作 用 是 变量 x 的 值 骨 为 3， 并 将 栈 顶 的 异 间 抛 出 ， 方 法 结束 。 


尽管 大 家 都 知道 这 段 代 码 出 现 异 常 的 概率 非常 小 ， 但 并 不 影响 它 
为 我 们 党 示 异 常 表 的 作用 。 如 果 大 家 到 这 里 仍然 对 字 太 码 的 运作 过 程 
比较 模糊 ， 其 实 也 不 要 紧 ， 关 于 虚拟 机 执行 字 市 码 的 过 程 ， 本 书 第 8 章 
中 将 会 有 更 详细 的 讲解 。 


2.Exceptions 属 性 


这 里 的 Exceptions 属 性 是 在 方法 表 中 与 Code 属 性 平 级 的 一 项 属性 ， 
读者 不 要 与 前 面 刚 刚 讲 解 完 的 异 利 表 产生 混 消 。Exceptions 属 性 的 作用 
是 列举 出 方法 中 可 能 抛 出 的 受 查 异常 (Checked Excepitons) ， 也 就 是 
方法 描述 时 在 throws 关 键 字 后 面 列 举 的 异 遂 。 它 的 结构 见 表 6-17。 


表 6-17 属性 表 结 构 


类 型 名 称 数 量 类 型 名 称 数 量 


u2 attribute_ name_ index | 1 | u2 | number of exceptions |1 


exception index table |number of exceptions 


Exceptions 属 性 中 的 number_of_exceptions 项 表示 方法 可 能 抛 出 


number_of_exceptions 种 受 查 异常 ， 每 一 种 受 查 异常 使 用 一 个 


exception_index_table 项 表示 ，exception_index_table 是 一 个 指 癌 常量 池 


中 CONSTANT _Class_info 型 销量 的 索引 ， 代 表 了 该 受 查 异 销 的 类 型 。 


3.LineNumberTable 属 性 


LineNumberTable 属 性 用 于 描述 Java 源 码 行 号 与 字 节 码 行 号 ( 字 节 
码 的 偏 移 量 ) 之 间 的 对 应 关系 。 它 并 不 是 运行 时 必需 的 属性 ， 但 默认 
会 生成 到 Class 文 件 之 中 ， 可 以 在 Javac 中 分 别 使 用 -g:none 或 -g:lines 选 项 
来 取消 或 要 求生 成 这 项 信息 。 如 果 选 择 不 生成 LineNumberTable 属 性 ， 
对 程序 运行 产生 的 最 主要 的 影响 就 是 当 抛 出 异常 时 ， 堆 栈 中 将 不 会 显 
示 出 错 的 行 号 ， 并 且 在 调试 程序 的 时 候 ， 也 无 法 按照 源码 行 来 设置 断 
点 。LineNumberTable 属 性 的 结构 见 表 6-18 。 


表 6-18 LineNumberTable 属性 结构 


E33 型 名 称 数 量 
u2 中 attribute_name_index 1 
u4 attribute _ length 1 
u2 line number table length 1 
line number info line number table line number table length 


line_number_table 是 一 个 数量 为 line_number_table_length、 类 型 为 
line_number_info 的 集合 ，line_number_info 表 包括 了 start_pc 和 
line_number 两 个 u2 类 型 的 数据 项 ， 前 者 是 字 蔬 码 行 号 ， 后 者 是 Java 源 码 


行 号 。 


4.LocalVariableTable 属 性 


LocalVariableTable 属 性 用 于 描述 栈 帧 中 局 部 变量 表 中 的 变量 与 Java 
源码 中 定义 的 变量 之 间 的 关系 ， 它 也 不 是 运行 时 必需 的 属性 ， 但 默认 
会 生成 到 Class 文 件 之 中 ， 可 以 在 Javac 中 分 别 使 用 -g:none 或 -g:vars 选 项 
来 取消 或 要 求生 成 这 项 信息 。 如 果 没 有 生成 这 项 属性 ， 最 大 的 影响 就 


是 当 其 他 人 引用 这 个 方法 时 ， 所 有 的 参数 名 称 都 将 会 丢失 ，IDE 将 会 使 
用 诸如 arg0、argl 之 类 的 占 位 符 代替 原 有 的 参数 名 ， 这 对 程序 运行 没有 
影响 ， 但 是 会 对 代码 编写 带 来 较 大 不 便 ， 而 且 在 调试 期 间 无 法 根据 参 
数 名 称 从 上 下 文中 获得 参数 值 。LocalVariableTable 属 性 的 结构 见 表 6- 
19° 


表 6-19 LocalVariableTable 属性 结构 
类 型 名 称 数 量 


u2 attribute name index 1 


u4 attribute_length 1 


u2 local variable table length 1 


local variable_info local variable table local_ variable table length 


其 中 ，local_variable_info 项 目 代 表 了 一 个 栈 帧 与 源码 中 的 局 部 变量 
的 关联， 结构 见 表 6-20。 


表 6-20 ”local_variable_info 项 目 结构 


类 型 名 称 数 量 
u2 start_ pe 1 
u2 length 1 
u2 name _ index 1 
u2 descriptor_index 1 
u2 index 1 


start_pc 和 length 属 性 分 别 代表 了 这 个 局 部 变量 的 生命 周期 开始 的 字 
节 码 偏 移 量 及 其 作用 范围 履 盖 的 长 度 ， 两 者 结合 起 来 就 是 这 个 局 部 变 
量 在 字 蔬 人 码 之 中 的 作用 域 范围 。 


name_index 和 descriptor_index 都 是 指向 常量 池 中 
CONSTANT_Utf8_info 型 沼 量 的 索引 ， 分 别 代 表 了 局 部 变量 的 名 称 以 及 


这 个 局 部 变量 的 描述 符 。 


index 是 这 个 局 部 变量 在 栈 帧 局 部 变量 表 中 Slot 的 位 置 。 当 这 个 变量 
数据 类 型 是 64 位 类 型 时 (double 和 long) ， 它 占用 的 Slot 为 index 和 


index+1 了 两 个 。 


顺便 提 一 下 ， 在 JDK 1.5 引 入 泛 型 之 后 ，LocalVariableTable 属 性 增 
加 了 一 个 “姐妹 属性 ”LocalVariableTypeTable， 这 个 新 增 的 属性 结构 与 
LocalVariableTable 非 常 相 似 ， 仅 仅 是 把 记录 的 字段 描述 符 的 
descriptor_index 替 换 成 了 字段 的 特征 签名 〈Signature) ， 对 于 非 泛 型 类 
型 来 说 ， 摘 述 符 和 特征 签名 能 描述 的 信息 是 基本 一 致 曲 ， 但 是 泛 型 引 
入 之 后 ， 由 于 描述 符 中 泛 型 的 参数 化 类 型 被 擦 除 掉 由， 描述 符 就 不 能 准 
确 地 摘 述 泛 型 类 型 了 ， 因 此 出 现 了 LocalVariableTypeTable 。 


5.SourceFile 属 性 


SourceFile 属 性 用 于 记录 生成 这 个 Class 文 件 的 源码 文件 名 称 。 这 个 
属性 也 是 可 选 的 ， 可 以 分 别 使 用 Javac 的 -g:none 或 -g:source 选 项 来 关闭 
或 要 求生 成 这 项 信息 。 在 Java 中 ， 对 于 大 多 数 的 类 来 说 ， 类 名 和 文件 名 
征 一 致 的 ， 但 是 有 一 些 特 殊 情 况 〈 如 内 部 类 ) 例外 。 如 果 不 生成 这 项 


属性 ， 当 抛 出 异 章 时 ， 堆 栈 中 将 不 会 显示 出 钳 代 码 所 属 的 文件 名 。 这 
个 属性 是 一 个 定 长 的 属性 ， 其 结构 见 表 6-21。 


表 6-21 SourceFile 属性 结构 
类 型 名 称 数 量 


| attribute name index 


u4 | attribute_length | 1 


sourcefile index 


sourcefile_index 数 据 项 是 指向 常量 池 中 CONSTANT_Utf8_info 型 常 
量 的 索引 ， 常 量 值 是 源码 文件 的 文件 名 。 


6.ConstantValue 属 性 


ConstantValue 属 性 的 作用 是 通知 虚拟 机 自动 为 静态 变量 赋值 。 只 有 
被 static 关 键 字 修饰 的 变量 (类 变量 ) 才 可 以 使 用 这 项 属性 。 类 似 "int 
x=123" 和 "static int x=123" 这 样 的 变量 定义 在 Java 程 序 中 是 非常 常见 的 事 
情 ， 但 虚拟 机 对 这 两 种 变量 赋值 的 方式 和 时 刻 都 有 所 不 同 。 对 于 非 
static 类 型 的 变量 (也 就 是 实例 变量 ) 的 赋值 是 在 实例 构造 器 <init> 方 
法 中 进行 的 ， 而 对 于 类 变量 ， 则 有 两 种 方式 可 以 选择 : 在 类 构造 器 < 
clinit> 方 法 中 或 者 使 用 ConstantValue 属 性 。 目 前 Sun Javac 编 译 器 的 选 
择 是 : 如 果 同 时 使 用 final 和 static 来 修饰 一 个 变量 〈 按 照 习 惯 ， 这 里 
称 “ 常 量 * 更 贴切 ) ， 并 且 这 个 变量 的 数据 类 型 是 基本 类 型 或 者 
java.lang.String 的 话 ， 就 生成 ConstantValue 属 性 来 进行 初始 化 ， 如 果 这 


个 变量 没有 被 final 修 饰 ， 或 者 并 非 基 本 类 型 及 字符 串 ， 则 将 会 选择 在 < 
clinit> 方 法 中 进行 初始 化 。 


虽然 有 final 关 键 字 才 更 符合 "ConstantValue" 的 语义 ， 但 虚拟 机 规范 
中 并 没有 强制 要 求 字 段 必 须 设置 了 ACC_FINAL 标 志 ， 只 要 求 了 有 
ConstantValue 属 性 的 字段 必须 设置 ACC_STATIC 标 志 而 已 ， 对 final 关 键 
字 的 要 求 是 Javac 编 译 器 目 己 加 入 的 限制 。 而 对 ConstantValue 的 属性 值 
只 能 限于 基本 类 型 和 String， 不 过 笔者 不 认为 这 是 什么 限制 ， 因 为 此 属 
性 的 属性 值 只 是 一 个 常量 池 的 索引 号 ， 由 于 Class 文 件 格式 的 常量 类 型 
中 只 有 与 基本 属性 和 字符 串 相 对 应 的 字面 量 ， 所 以 就 算 ConstantValue 属 
性 想 支持 别 的 类 型 也 无 能 为 力 。ConstantValue 属 性 的 结构 见 表 6-22 。 


表 6-22 ConstantValue 属性 结构 


u2 attribute name index 1 


u4 attribute_ length 1 


u2 constantvalue index 1 


从 数据 结构 中 可 以 看 出 ，ConstantValue 属 性 是 一 个 定 长 属性 ， 它 的 
attribute_length 数 据 项 值 必须 固定 为 2。constantvalue_index 数 据 项 代表 
了 常量 池 中 一 个 字面 量 常 量 的 引用 ， 根 据 字 段 类 型 的 不 同 ， 字 面 量 可 
以 是 CONSTANT _Long_info、CONSTANT_Float_info 、 


CONSTANT_Double_info ~、 CONSTANT_Integer_info 、 
CONSTANT_String_info 常 量 中 的 一 种 。 


7.InnerClasses 属 性 


InnerClasses 属 性 用 于 记录 内 部 类 与 宿主 类 之 间 的 关联 。 如 果 一 个 
类 中 定义 了 内 部 类 ， 那 编译 万 将 会 为 它 以 及 它 所 包含 的 内 部 类 生成 
InnerClasses 属 性 。 该 属性 的 结构 见 表 6-23。 


表 6-23 InnerClasses 属性 结构 


类 型 名 称 数 量 
u2 attribute name index 1 
u4 attribute_ length 1 
u2 number of classes 1 
inner classes_info inner classes number of classes 


数据 项 number_of_classes 代 表 和 需要 记 杂 多 少 个 内 部 类 信息 ， 每 一 个 
内 部 类 的 信息 都 由 一 个 inner_classes_info 表 进行 描述 。inner_classes_info 


表 的 结构 见 表 6-24。 


表 6-24 inner_classes _info 表 的 结构 


类 型 名 称 数 量 
u2 inner_class_info_index 1 
u2 outer class info index 1 
u2 inner name index 1 
u2 inner class access flags 1 


inner_class_info index 和 outer_class_info_index 都 是 指 疝 常量 池 中 
CONSTANT_Class_info 型 常量 的 索引 ， 分 别 代表 了 内 部 类 和 宿主 类 的 


符号 引用 。 


inner_name_index 是 指向 第 量 池 中 CONSTANT_Utf8_info 型 常量 的 
索引 ， 代 表 这 个 内 部 类 的 名 称 ， 如 果 是 匿名 内 部 类 ， 那 么 这 项 值 为 0。 


inner_class_access_flags 是 内 部 类 的 访问 标志 ， 类 似 于 类 的 
access_flags， 它 的 取 值 范围 见 表 6-25。 


表 6-25 inner_class_access_flags 标志 


标志 名 称 标志 值 含 X 
ACC PUBLIC 0x0001 内 部 类 是 否 为 public 
ACC PRIVATE 0x0002 内 部 类 是 否 为 private 
ACC _ PROTECTED 0x0004 内 部 类 是 否 为 protected 
ACC_STATIC 0x0008 内 部 类 是 否 为 static 
ACC FINAL 0x0010 内 部 类 是 否 为 final 
ACC INTERFACE 0x0020 内 部 类 是 否 为 synchronized 
ACC ABSTRACT 0x0400 内 部 类 是 否 为 abstract 
ACC SYNTHETIC 0x1000 内 部 类 是 否 并 非 由 用 户 代 码 产生 的 
ACC ANNOTATION 0x2000 内 部 类 是 否 是 一 个 注解 
ACC _ ENUM 0x4000 内 部 类 是 否 是 一 个 枚 举 


8.Deprecated 及 Synthetic 属 性 


Deprecated 和 Synthetic 两 个 属性 都 属于 标志 类 型 的 布尔 属性 ， 只 存 
在 有 和 没有 的 区 别 ， 没 有 属性 值 的 概念 。 


Deprecated 属 性 用 于 表示 某 个 类 、 字 段 或 者 方法 ， 已 经 被 程序 作者 
定 为 不 再 推荐 使 用 ， 它 可 以 通过 在 代码 中 使 用 @deprecated 广 释 进 行 设 
署 。 


Synthetic 属性 代表 此 字段 或 者 方法 并 不 是 由 Java 源 码 直 接 产 生 的 ， 
而 是 由 编译 器 自行 添加 的 ， 在 JDK 1.5 之 后 ， 标 识 一 个 类 、 字 段 或 者 方 


法 是 编译 器 目 动 产生 的 ， 也 可 以 设置 它们 访问 标志 中 的 
ACC_SYNTHETIC 标 志 位 ， 其 中 最 典型 的 例子 就 是 Bridge Method。 所 
有 由 非 用 户 代码 产生 的 类 、 方 法 及 字段 都 应 当 至 少 设置 Synthetic 属性 和 
ACC_SYNTHETIC 标 志 位 中 的 一 项 ， 唯 一 的 例外 是 实例 构造 器 "< init 
> "方法 和 类 构造 器 "< clinit> "方法 。 


Deprecated 和 Synthetic 属性 的 结构 非 名 和 价 单 ， 见 表 6-26。 


表 6-26 Deprecated 及 Synthetic 属性 的 结构 
类 型 名 称 数 量 


u2 | attribute name index | 1 


attribute length 


其 中 attribute_length 数 据 项 的 值 必须 为 0x00000000， 因 为 没有 任何 
属性 值 需要 设置 。 


9.StackMapTable 属 性 


StackMapTable 属 性 在 JDK 1.6 发 布 后 增加 到 了 Class 文 件 规范 中 ， 它 
是 一 个 复杂 的 变 长 属性 ， 位 于 Code 属 性 的 属性 表 中 。 这 个 属性 会 在 虚 
拟 机 类 加 载 的 字 节 码 验 证 阶段 被 新 类 型 检查 验证 器 (Type Checker) 使 
用 ( 见 7.3.2 市 ) ， 目 的 在 于 代替 以 前 比较 消耗 性 能 的 基于 数据 流 分 析 
的 类 型 推导 验证 器 。 


这 个 类 型 检查 验证 器 最 初 来 源 于 Sheng Liang 〈 听 名 字 似 乎 是 虚拟 
机 团队 中 的 华裔 成 员 ) 为 Java ME CLDC 实 现 的 字 节 码 验 证 器 。 新 的 验 


证 器 在 同样 能 保证 Class 文 件 合 法 性 的 前 提 下 ， 省 略 了 在 运行 期 通过 类 
据 流 分 析 去 确认 字 节 码 的 行为 逻辑 合法 性 的 步骤 ， 而 是 在 编译 阶段 将 
一 系列 的 验证 类 型 《Verification Types) 直接 记录 在 Class 文 件 之 中 ， 通 
过 检查 这 些 验 证 类 型 代替 了 类 型 推导 过 程 ， 从 而 大 幅 提升 了 字 节 人 码 验 
证 的 性 能 。 这 个 验证 器 在 JDK 1.6 中 首次 提供 ， 并 在 JDK 1.7 中 强制 代替 
原本 基于 类 型 推断 的 字 节 码 验 证 器 。 关 于 这 个 验证 器 的 工作 原理 ， 

《Java 虚 拟 机 规范 (Java SE 7 版 ) 》 人 花费 了 整整 120 页 的 篇 幅 来 讲解 描 
述 ， 并 且 分 析 证 明 新 验证 方法 的 严谨 性 ， 笔 者 在 此 不 再 玖 述 。 


洋 


StackMapTable 属 性 中 包含 零 至 多 个 栈 映 射 帧 (Stack Map 
Frames) ， 每 个 栈 映 射 帧 都 显 式 或 隐 式 地 代表 了 一 个 字 闻 码 偏 移 量 ， 
用 于 表示 该 执行 到 该 字 节 码 时 局 部 变量 表 和 操作 数 栈 的 验证 类 型 。 类 
型 检查 验证 器 会 通过 检查 目标 方法 的 局 部 变量 和 操作 数 栈 所 需要 的 类 
型 来 确定 一 段 字 世人 码 指 令 是 否 符合 逻辑 约束 。StackMapTable 属 性 的 结 
构 见 表 6-27。 


表 6-27 StackMapTable 属性 的 结构 
尖 型 名 称 数 量 
u2 attribute name_ index 1 
u4 attribute_length 1 


u2 number of entries 1 


stack map frame stack map_frame entries number of entries 


《Java 虚 拟 机 规范 (Java SE 7 版 ) 》 明 确 规 定 : 在 版 本 号 大 于 或 等 
于 50.0 的 Class 文 件 中 ， 如 果 方 法 的 Code 属 性 中 没有 附带 StackMapTable 


属性 ， 那 束 意 味 着 它 带 有 一 个 隐 式 的 StackMap 属 性 。 这 个 StackMap 属 
性 的 作用 等 同 于 number_of_entries 值 为 0 的 StackMapTable 属 性 。 一 个 方 
法 的 Code 属 性 最 多 只 能 有 一 个 StackMapTable 必 性， 否则 将 抛 出 


ClassFormatError 异 常 。 
10.Signature 属 性 


Signature 属 性 在 JDK 1.5 发 布 后 增加 到 了 Class 文 件 规范 之 中 ， 它 是 

一 个 可 选 的 定 长 属性 ， 可 以 出 现 于 类 、 属 性 表 和 方法 表 结 构 的 属性 表 
中 。 在 JDK 1.5 中 大 幅 增强 了 Java 语 言 的 语法 ， 在 此 之 后 ， 任 何 类 、 接 
口 、 初 始 化 方法 或 成 员 的 泛 型 签名 如 果 包 含 了 类 型 变量 (Type 
Variables) 或 参数 化 类 型 (Parameterized Types) ， 则 Signature 属 性 会 
为 它 记 录 泛 型 签名 信息 。 之 所 以 要 专门 使 用 这 样 一 个 属性 去 记录 汉 型 
类 型 ， 是 因为 Java 语 言 的 泛 型 采用 的 是 擦 除法 实现 的 伪 泛 型 ， 在 字 节 码 

(Code 属 性 ) 中 ， 泛 型 信息 编译 (类 型 变量 、 参 数 化 类 型 ) 之 后 都 通 
通 被 擦 除 挥 。 使 用 擦 除法 的 好 处 是 实现 简单 (主要 修改 Javac 编 译 器 ， 
虚拟 机 内 部 只 做 了 很 少 的 改动 ) 、 非 常 容易 实现 Backport， 运 行 期 也 能 
够 万 省 一 些 类 型 所 占 的 内 存 空间 。 但 坏处 是 运行 期 束 无 法 像 C# 等 有 真 
泛 型 文 持 的 语言 那样 ， 将 泛 型 类 型 与 用 户 定义 的 普通 类 型 同等 对 待 ， 
例如 运行 期 做 反射 时 无 法 获得 到 泛 型 信息 。Signature 属 性 就 是 为 了 弥补 
这 个 缺陷 而 增设 的 ， 现 在 Java 的 反射 API 能 够 获取 泛 型 类 型 ， 最 终 的 数 
据 来 源 也 就 是 这 个 属性 。 关 于 Java 泛 型 、Signature 属 性 和 类 型 擦 除 ， 在 


第 10 章 介绍 编译 右 优 化 的 时 候 会 通过 一 个 具体 的 例子 来 讲解 。Signature 
属性 的 结构 见 表 6-28 。 


表 6-28 Signature 属性 的 结构 
类 型 名 称 数 量 


u2 attribute_ name index 1 


u4 attribute length 1 


u2 signature index 1 


其 中 signature_index 项 的 值 必须 是 一 个 对 常量 池 的 有 殖 索 引 。 香 量 
池 在 该 索引 处 的 项 必须 是 CONSTANT _Utf8_info 结 构 ， 表 示 类 签名 、 方 
法 类 型 签名 或 字段 类 型 签名 。 如 果 当 前 的 Signature 属 性 是 类 文件 的 属 
性 ， 则 这 个 结构 表示 类 签名 ， 如 果 当 前 的 Signature 属 性 是 方法 表 的 属 
性 ， 则 这 个 结构 表示 方法 类 型 签名 ， 如 条 当前 Signature 属 性 是 字段 表 的 
属性 ， 则 这 个 结构 表示 字段 类 型 签名 。 


11.BootstrapMethods 属 性 


BootstrapMethods 属 性 在 JDK 1.7 发 布 后 增加 到 了 Class 文 件 规范 之 
中 ， 它 是 一 个 复杂 的 变 长 属性 ， 位 于 类 文件 的 属性 表 中 。 这 个 属性 用 
于 保存 invokedynamic 指 令 引 用 的 引导 方法 限定 符 。《Java 虚 拟 机 规范 
(Java SE 7 版 ) 》 规 定 ， 如 果 某 个 类 文件 结构 的 常量 池 中 曾经 出 现 过 
CONSTANT_InvokeDynamic_info 类 型 的 常量 ， 那 么 这 个 类 文件 的 属性 
表 中 必须 存在 一 个 明确 的 BootstrapMethods 属 性 ， 另 外 ， 即 使 
CONSTANT _InvokeDynamic_info 类 型 的 常量 在 常量 池 中 出 现 过 多 次 ， 


类 文件 的 属性 表 中 最 多 也 只 能 有 一 个 BootstrapMethods 属 性 。 
BootstrapMethods 属 性 与 JSR-292 中 的 InvokeDynamic 指 令 和 
java.lang.Invoke 包 关系 非常 密切 ， 要 介绍 这 个 属性 的 作用 ， 必 须 先 弄 清 
楚 InovkeDynamic 指 令 的 运作 原理 ， 笔 者 将 在 第 8 章 专 门 用 1 市 篇 幅 去 介 
绍 它 们 ， 在 此 先 暂 时 略 过 。 


目前 的 Javac 暂 时 无 法 生成 InvokeDynamic 指 令 和 BootstrapMethods 
属性 ， 必 须 通过 一 些 非 常规 的 手段 才能 使 用 到 它们 ， 也 许 在 不 久 的 将 
来 ， 等 JSR-292 更 加 成 熟 一 些 ， 这 种 状况 束 会 改变 。BootstrapMethods 属 
性 的 结构 见 表 6-29 。 


表 6-29 BootstrapMethods 属性 的 结构 


名 称 


attribute name index 


attribute length 


num bootstrap_methods 1 


bootstrap_method bootstrap_methods num_ bootstrap_methods 


其 中 引用 到 的 bootstrap_method 结 构 见 表 6-30。 


表 6-30 ”bootstrap_method 属性 的 结构 


类 型 名 称 数 量 
u2 | bootstrap_method_ ref | 1 
u2 | num bootstrap arguments | 1 


bootstrap_arguments num_ bootstrap_arguments 


BootstrapMethods 属 性 中 ，num_bootstrap_methods 项 的 值 给 出 了 
bootstrap_methods[] 数 组 中 的 引导 方法 限定 符 的 数量 。 而 


bootstrap_methods[] 数 组 的 每 个 成 员 包 含 了 一 个 指 疝 常量 池 
CONSTANT_MethodHandle 结 构 的 索引 值 ， 它 代表 了 一 个 引导 方法 ， 还 
包含 了 这 个 引导 方法 静态 参数 的 序列 〈 可 能 为 空 ) 。 
bootstrap_methods[] 数 组 中 的 每 个 成 员 必 须 包含 以 下 3 项 内 容 。 


bootstrap_method_ref:bootstrap_method_ref 项 的 值 必须 是 一 个 对 常 
量 池 的 有 效 索 引 。 常 量 池 在 该 索引 处 的 值 必须 是 一 个 
CONSTANT_MethodHandle_info 结 构 。 


num_bootstrap_arguments:num_bootstrap_arguments 项 的 值 给 出 了 


bootstrap_arguments[] 数 组 成 员 的 数量 。 


bootstrap_arguments[]: bootstrap_arguments[] 数 组 的 每 个 成 员 必 须 
是 一 个 对 常量 池 的 有 效 有 索引。 常量 池 在 该 索引 处 必须 是 下 列 结 构 之 
一 : CONSTANT String_info ~、 CONSTANT_Class_info 、 


CONSTANT_Integer_info ~、 CONSTANT_Long_info 、 
CONSTANT _ Float info、CONSTANT _ Double info、 
CONSTANT_MethodHandle_info 或 CONSTANT_MethodType_info o 


[1] 此 处 字 节 码 的 “ 行 * 是 一 种 形象 的 描述 ， 指 的 是 字 节 码 相 对 于 方法 体 
开始 的 偏 移 量 ， 而 不 是 Java 源 码 的 行 号 ， 下 同 。 

[2] 在 JDK1.4.2 之 前 的 Javac 编 译 器 采用 了 jsr 和 ret 指 令 实 现 finally 语 句 ， 但 
1.4.2 之 后 已 经 改 为 编译 器 自动 在 每 段 可 能 的 分 支 路 径 之 后 都 将 finally 语 


句 块 的 内 容 宛 余生 成 一 遍 来 实现 finally 语 义 。 在 JDK 1.7 中 ， 已 经 完全 
荣 止 Class 文 件 中 出 现 jsr 和 ret 指 令 ， 如 末 遇 到 这 两 条 指令 ， 虚 拟 机 会 在 
类 加 载 的 字 市 码 校 验 阶 段 抛 出 异 肖 。 

[3] 详 见 第 10 革 中 关于 语法 糖 部 分 的 内 容 。 


Java 虚 拟 机 的 指令 由 一 个 字 节 长 度 的 、 代 表 着 某 种 特定 操作 含义 的 
数字 〈 称 为 操作 码 ，Opcode) 以 及 跟随 其 后 的 零 至 多 个 代表 此 操作 所 
需 参 数 〈 称 为 操作 数 ，Operands) 而 构成 。 由 于 Java 虚 拟 机 采用 面 回 操 
作 数 栈 而 不 是 寄存 器 的 架构 (这 两 种 架构 的 区 别 和 影响 将 在 第 8 革 中 探 
讨 ) ， 所 以 大 多 数 的 指令 都 不 包含 操作 数 ， 只 有 一 个 操作 码 。 


字 市 码 指 令 集 是 一 种 具有 鲜明 特点 、 优 和 劣势 部 很 突出 的 指令 集 染 
构 ， 由 于 限制 了 Java 虚 拟 机 操作 码 的 长 度 为 一 个 字 市 ( 即 0~255) ， 这 
意味 着 指令 集 的 操作 码 总 数 不 可 能 超过 256 条 ; 又 由 于 Class 文 件 格式 放 
弃 了 编译 后 代码 的 操作 数 长 度 对 齐 ， 这 束 意 味 着 虚拟 机 处 理 那 些 超 过 
一 个 字数 据 的 时 候 ， 不 得 不 在 运行 时 从 字 节 中 重建 出 具体 数据 的 结 
构 ， 如 有 果 要 将 一 个 16 位 长 度 的 无 符号 整数 使 用 两 个 无 符号 字 市 存储 起 
来 (将 它们 命名 为 bytel 和 byte2) ， 那 它们 的 值 应 该 是 这 样 的 : 


(byte1< <8) |byte2 


这 种 操作 在 某 种 程度 上 会 导致 解释 执行 字 市 码 时 损失 一 些 性 能 。 
但 这 样 做 的 优势 也 非常 明显 ， 放 弃 了 操作 数 长 度 对 齐 路 ， 就 意味 着 可 以 
省 略 很 多 填充 和 间隔 符号 ;用 一 个 字 世 来 代表 操作 码 ， 也 是 为 了 尽 可 
能 获得 短小 精干 的 编译 代码 。 这 种 追求 尽 可 能 小 数据 量 、 高 传输 效率 


的 设计 是 由 Java 语 言 设计 之 初 面 癌 网 络 、 知 能 家 电 的 技术 背景 所 决定 
的 ， 并 一 直 治 用 至 今 。 


如 果 不 考虑 异常 处 理 的 话 ， 那 么 Java 虚 拟 机 的 解释 器 可 以 使 用 下 面 
这 个 仿 代 码 当做 最 基本 的 执行 模型 来 理解 ， 这 个 执行 模型 虽然 很 简 
单 ， 但 依然 可 以 有 效 地 工作 : 


dof{ 

自动 计算 PC 寄存 器 的 值 加 1; 

根据 PC 寄存 器 的 指示 位 置 ， 从 字 节 码 流 中 取出 操作 码 ; 
if ( 字 节 码 存 在 操作 数 ) 从 字 节 码 流 中 取出 操作 数 ; 
执行 操作 码 所 定义 的 操作 ; 

}while ( 字 节 码 流 长 度 >0) ; 


6.4.1 字 世 码 与 数据 类 型 


在 Java 庶 拟 机 的 指令 集中 ， 大 多 数 的 指令 都 包 侣 了 其 操作 所 对 应 的 
数据 类 型 信息 。 例 如 ，iload 指 令 用 于 从 局 部 变量 表 中 加 载 int 型 的 数据 
到 操作 数 栈 中 ， 而 fload 指 令 加 载 的 则 古 float 类 型 的 数据 。 这 两 条 指令 
的 操作 在 虚拟 机 内 部 可 能 会 古 由 同一 段 代码 来 实现 的 ， 但 在 Class 文 件 
中 它们 必须 拥有 各 目 独 立 的 操作 码 。 


对 于 大 部 分 与 数据 类 型 相关 的 子 太 码 指令 ， 它 们 的 操作 码 助 记 符 
中 都 有 特殊 的 字符 来 表明 专门 为 哪 种 数据 类 型 服务 ，i 代 表 对 int 类 型 的 
数据 操作 ，1]1 代 表 long,s 代 表 shortb 代 表 byte,c 代 表 charf 代 表 float,d 代 表 
double,a 代 表 reference。 也 有 一 些 指令 的 助 记 符 中 没有 明确 地 指明 操作 


类 型 的 字母 ， 如 arraylengh 指 令 ， 它 没有 代表 数据 类 型 的 特殊 字符 ， 但 
操作 数 永远 只 能 是 一 个 数组 类 型 的 对 象 。 还 有 另外 一 些 指令 ， 如 无 条 
件 跳 转 指令 goto 则 是 与 数据 类 型 无 关 的 。 


由 于 Java 虚 拟 机 的 操作 码 长 度 只 有 一 个 字 市 ， 所 以 包含 了 数据 类 型 
的 操作 码 束 为 指令 集 的 设计 市 来 了 很 大 的 压力 ， 如 来 每 一 种 与 数据 类 
型 相关 的 指令 都 文 持 Java 虚 拟 机 所 有 运行 时 数据 类 型 的 话 ， 那 指令 的 数 
量 您 怕 就 会 超出 一 个 字 市 所 能 表示 的 数量 范围 了 。 因 此，Java 虚 拟 机 的 
站 令 集 对 于 特定 的 操作 只 提供 了 有 限 的 类 型 相关 指令 去 文 持 它 ， 换 句 
话说 ， 指 令 集 将 会 故意 被 设计 成 非 完全 独立 的 (Java 虚 拟 机 规范 中 把 这 
种 特性 称 为 "Not Orthogonal"， 即 并 非 每 种 数据 类 型 和 每 一 种 操作 都 有 
对 应 的 指令 ) 。 有 一 些 单独 的 指令 可 以 在 必要 的 时 候 用 来 将 一 些 不 文 
持 的 类 型 转换 为 可 被 文 持 的 类 型 。 


表 6-31 列 举 了 Java 虚 拟 机 所 支持 的 与 数据 类 型 相关 的 子 市 码 指 令 ， 
通过 使 用 数据 类 型 列 所 代表 的 特殊 字符 软 换 opcode 列 的 指令 模板 中 的 
T， 束 可 以 得 到 一 个 具体 的 字 节 码 指 令 。 如 来 在 表 中 指令 模板 与 数据 类 
型 两 列 共同 确定 的 格 为 宝 ， 则 说 明 虚 拟 机 不 支持 对 这 种 数据 类 型 执行 
这 项 操作 。 例 如 ，load 指 令 有 操作 int 类 型 的 iload， 但 是 没有 操作 byte 类 
型 的 同类 指令 。 


注意 ， 从 表 6-31 中 可 以 看 出 ， 大 部 分 的 指令 都 没有 文 持 整数 类 型 
byte、char 和 short， 甚 至 没有 任何 指令 文 持 boolean 类 型 。 编 译 器 会 在 编 


译 期 或 运行 期 将 byte 和 short 类 型 的 数据 带 符 号 扩展 (Sign-Extend) 为 相 
应 的 int 类 型 数据 ， 将 boolean 和 char 类 型 数据 零 位 扩展 (Zero-Extend) 
为 相应 的 int 类 型 数据 。 与 之 类 似 ， 在 处 理 boolean、byte、short 和 char 类 
型 的 数组 时 ， 也 会 转换 为 使 用 对 应 的 int 类 型 的 字 节 码 指令 来 处 理 。 
此 ， 大 多 数 对 于 boolean、byte、short 和 char 类 型 数据 的 操作 ， 实 际 上 都 


O 


是 使 用 相应 的 int 类 型 作为 运算 类 型 (Computational Type) 


表 6-31 Java 虚拟 机 指令 集 所 支持 的 数据 类 型 


Tipush bipush sipush 
Tconst iconst lconst fconst dconst aconst 


iload lload fload dload aload 


Tload 


( 续 ) 


opcode byte short int long float double char reference 


Tstore istore lstore fstore dstore astore 


Tinc iinc 


Taload baload saload iaload laload faload daload caload aaload 


Tastore bastore sastore iastore lastore fastore dastore castore aastore 
Tadd 
Tsub S fsub 


上 
Tmul fmul 


Tdiv 


Trem 
Tneg 
Tshl 
Tshr 


Tushr 
Tand 
Tor 


Txor 
i2T i2b 
RT 
fT 
d2T 


Temp 
Tcmpl 


Tempg 


et 了 下 F 
if TempOP if icmpOP if acmpOP 
1 | | 
Treturn ireturn lreturn freturn dreturn areturn 


在 本 革 中 ， 受 篇 幅 所 限 ， 无 法 对 字 市 码 指令 集中 每 条 指令 进行 逐 
一 讲解 ， 但 阅读 字 市 码 作 为 了 解 Java 虚 拟 机 的 基础 技能 ， 是 一 项 应 当 熟 
练 掌 握 的 能 力 。 笔 者 将 字 市 码 操 作 按 用 途 大 致 分 为 9 类 ， 按 照 分 类 来 为 
读者 概略 介绍 一 下 这 些 指 令 的 用 法 。 如 果 读 者 需要 了 解 更 详细 的 信 
轧 ， 可 以 参考 阅读 笔者 翻译 的 《Java 虚 拟 机 规范 (Java SE 7 版 ) 》 的 第 


一 过 


6 齐 。 


[ 字 和 有 人 码 指 令 流 基本 上 都 是 单字 和 对齐 的 ， 只 
有 "tableswitch" 和 "lookupswitch" 两 条 指令 例外 ， 由 于 它们 的 操作 数 比较 
特殊 ， 是 以 4 字 下 为 界 划 分 开 的 ， 所 以 这 两 条 指令 也 需要 预 留 出 相应 的 


空位 进行 填充 来 实现 对 齐 。 


6.4.2 ”加 载 和 存储 指令 


加 载 和 存储 指令 用 于 将 数据 在 栈 帧 中 的 局 部 变量 表 和 操作 数 栈 
( 见 第 2 章 关 于 内 存 区 域 的 介绍 ) 之 间 来 回 传输 ， 这 类 指令 包括 如 下 内 


容 。 


SS 


将 一 个 局 部 变量 加 载 到 操作 栈 : iload、iload_ <n>、]load、]lload _ 
<n>、fload、fload <n> 、dload、dload <n>、aload、aload_ <n 


> 0o 


将 一 个 数值 从 操作 数 栈 存储 到 局 部 变量 表 : istore 、istore_<n>、 
lstore 、 lstore _ <n> 、fstore ~ fstore <n> 、dstore 、 dstore <n>、 


astore ~ astore <n>>° 


将 一 个 常量 加 载 到 操作 数 栈 : bipush、sipush、ldc、ldc_w、 
ldc2 w 、 aconst_ null ~、 iconst m1 、 iconst <i> 、]const 1>、fconst 


<f> 、dconst <d>。 


扩充 局 部 变量 表 的 访问 索引 的 指令 : wide。 


存储 数据 的 操作 数 栈 和 局 部 变量 表 主要 就 是 由 加 载 和 存储 指令 进 
行 操作 ， 除 此 之 外 ， 还 有 少量 指令 ， 如 访问 对 象 的 字段 或 数组 元 素 的 
指令 也 会 向 操作 数 栈 传 输 数 据 。 


上 面 所 列举 的 指令 助 记 符 中 ， 有 一 部 分 是 以 尖 括 号 结尾 的 (例如 
iload_<n>) ， 这 些 指令 助 记 符 实 际 上 是 代表 了 一 组 指令 (例如 iload_ 
<n>， 它 代表 了 iload 0、iload_1、iload_ 2 和 iload 3 这 几 条 指令 ) 。 这 
几 组 指令 都 是 某 个 带 有 一 个 操作 数 的 通用 指令 (例如 iload) 的 特殊 形 
式 ， 对 于 这 若干 组 特殊 指令 来 说 ， 它 们 省 略 掉 了 显 式 的 操作 数 ， 不 需 
要 进行 取 操 作 数 的 动作 ， 实 际 上 操作 数 就 隐 含 在 指令 中 。 除 了 这 点 之 
外 ,它们 的 语义 与 原生 的 通用 指令 完全 一 臻 《例如 iload_0 的 语义 与 操 
作 数 为 0 时 的 iload 指 令 语 义 完 全 一 致 ) 。 这 种 指令 表示 方法 在 本 书 以 及 
《Java 虚 拟 机 规范 》 中 都 是 通用 的 。 


6.4.3 ”运算 指令 


运算 或 算术 指令 用 于 对 两 个 操作 数 栈 上 的 值 进行 采种 特定 运算 ， 
并 把 结果 重新 存 入 到 操作 栈 顶 。 大 体 上 算术 指令 可 以 分 为 两 种 : 对 整 
型 数据 进行 运算 的 指令 与 对 译 点 型 数据 进行 运算 的 指令 ， 无 论 羡 哪 种 
算术 指令 ， 都 使 用 Java 虚 拟 机 的 数据 类 型 ， 由 于 没有 直接 文 持 byte、 
short、char 和 boolean 关 型 的 算术 指令 ， 对 于 这 类 数据 的 运算 ， 应 使 用 
操作 int 类 型 的 指令 代 蔡 。 整 数 与 浮 点 数 的 算术 指令 在 洲 出 和 被 符 除 的 
时 候 也 有 各 目 不 同 的 行为 表现 ， 所 有 的 算术 指令 如 下 。 


加 法 指令 : iadd、ladd 、fadd、dadd。 
减法 指令 : isub、1lsub、fsub、dsub。 
乘法 指令 : imul、lmul、fmul、dmul。 
除法 指令 : idiv、ldiv、fdiv、ddiv。 
求 余 指令 : irem 、l]rem 、frem 、drem。 
取 反 指令 : ineg、lneg、fneg、dneg。 


位 移 指 令 : ishl、ishr 、iushr、1lshl、1lshr、]lushr。 


按 位 或 指令 : ior、lor 。 
按 位 与 指令 : iand、land 。 
按 位 异 或 指令 : ixor、]xor。 
局 部 变量 目 增 指令 : iinc。 


比较 指令 : dcmpg、dcmpl、fcmpg、fcmpl、lcmp 。 


Java 虚 拟 机 的 指令 集 直 接 支持 了 在 《Java 语 言 规范 》 中 描述 的 各 
种 对 整数 及 浮 点 数 操作 (参见 《Java 语 言 规 范 (第 3 版 )》 中 的 4.2.2 节 
和 4.2.4 节 ) 的 语义 。 数 据 运算 可 能 会 导致 溢出 ， 例 如 两 个 很 大 的 正 整 
数 相 加 ， 结 果 可 能 会 是 一 个 负数 ， 这 种 数学 上 不 可 能 出 现 的 溢出 现 
象 ， 对 于 程序 员 来 说 是 很 容易 理解 的 ， 但 其 实 Java 虚 拟 机 规范 没有 明 
确定 义 过 整 型 数据 溢出 的 具体 运算 结果 ， 仅 规定 了 在 处 理 整 型 数据 
时 ， 只 有 除法 指令 〈\idiv 和 ldiv) 以 及 求 余 指令 (irem 和 ]rem) 中 当 出 


现 除 数 为 零 时 会 导致 虚拟 机 抛 出 ArithmeticException 异 稼 ， 其 余 任何 整 


一 /一 


型 数 运 算 场景 都 不 应 该 抛 出 运行 时 异 第 。 


Java 虚 拟 机 规范 要求 虚 拟 机 实现 在 处 理 浮 点 数 时 ， 必 须 严 格 遵循 
IEEE 754 规 范 中 所 规定 的 行为 和 限制 。 也 束 是 说 ，Java 虚 拟 机 必须 完 
全 文 持 IEEE 754 中 定义 的 非 正规 浮 点 数值 (Denormalized Floating- 


Point Numbers) 和 还 级 下 游 (Gradual Underflow) 的 运算 规则 。 这 些 
特征 将 会 使 某 些 数值 算法 处 理 起 来 变 得 相对 容易 一 些 。 


Java 虚 拟 机 要 求 在 进行 浮 点 数 运算 时 ， 所 有 的 运算 结果 都 必须 舍 
入 到 适当 的 精度 ， 非 精确 的 结果 必须 舍 入 为 可 被 表示 的 最 接近 的 精确 
值 ， 如 果 有 两 种 可 表示 的 形式 与 该 值 一 样 接近 ， 将 优先 选择 最 低 有 效 
位 为 零 的 。 这 种 合 入 模式 也 是 IEEE 754 规 范 中 的 默认 舍 入 模式 ， 称 为 
向 最 接近 数 合 入 模式 。 


在 把 浮 点 数 转换 为 整数 时 ，Java 虚 拟 机 使 用 IEEE 754 标 准 中 的 向 
零售 入 模式 ， 这 种 模式 的 舍 入 结果 会 导致 数字 被 截断 ， 所 有 小 数 部 分 
的 有 效 字 下 都 会 被 丢弃 掉 。 问 零售 人 模式 将 在 目标 数值 类 型 中 选择 一 
个 最 接近 但 和 是 不 大 于 诛 值 的 数字 来 作为 最 精确 的 售 和 人 绪 


另外 ，Java 虚 拟 机 在 处 理 译 点 数 运算 时 ， 不 会 抛 出 任何 运行 时 腊 
常 (这 里 所 讲 的 是 Java 语 言 中 的 异常 ， 请 读者 勿 与 IEEE 754 规 范 中 的 
浮 点 异常 互相 混淆 ，IEEE 754 的 浮 点 异常 是 一 种 运算 信号 ) ， 当 一 个 
操作 产生 溢出 时 ， 将 会 使 用 有 符号 的 无 穷 大 来 表示 ， 如 采 有 某 个 操作 结 
条 没有 明确 的 数学 定义 的 话 ， 将 会 使 用 NaN 值 来 表示 。 所 有 使 用 NaN 
值 作 为 操作 数 的 算术 操作 ， 结 末 都 会 返回 NaN。 


在 对 long 类 型 数值 进行 比较 时 ， 虚 拟 机 采用 带 符 号 的 比较 方式 ， 
而 对 浮 点 数值 进行 比较 时 〈dcmpg、dcmpl、fcmpg、fcmpl) ， 虚 拟 机 


会 采用 IEEE 754 规 范 所 定义 的 无 信号 比较 (Nonsignaling 


Comparisons) 方式 。 


6.4.4 ”类 型 转换 指令 


类 型 转换 指令 可 以 将 两 种 不 同 的 数值 类 型 进行 相互 转换 ， 这 些 转 
换 操作 一 般 用 于 实现 用 户 代码 中 的 显 式 类 型 转换 操作 ， 或 者 用 来 处 理 
本 世 开 篇 所 提 到 的 字 节 码 指令 集中 数据 类 型 相关 指令 无 法 与 数据 类 型 
一 一 对 应 的 问题 。 


Java 虚 拟 机 直接 支持 〈 即 转换 时 无 需 显 式 的 转换 指令 ) 以 下 数值 
类 型 的 宽 化 类 型 转换 (Widening Numeric Conversions， 即 小 范围 类 型 
问 大 范围 类 型 的 安全 转换 ) : 


int 类 型 到 long、float 或 者 double 类 型 。 
long 类 型 到 float、double 类 型 。 
float 类 型 到 double 类 型 。 


相对 的 ， 处 理 罕 化 类 型 转换 (Narrowing Numeric Conversions) 
时 ， 必 须 显 式 地 使 用 转换 指令 来 完成 ， 这 些 转换 指令 包括 : i2b、i2c、 
i2s、]12i、f2i、f21、d2i、d21 和 d2f。 罕 化 类 型 转换 可 能 会 导致 转换 结果 
产生 不 同 的 正 负 号 、 不 同 的 数量 级 的 情况 ， 转 换 过 程 很 可 能 会 导致 数 
值 的 精度 丢失 。 


在 将 int 或 1ong 类 型 罕 化 转换 为 整数 类 型 T 的 时 候 ， 转 换 过 程 仅仅 是 
人 简单 地 丢弃 除 最 低位 N 个 字 节 以 外 的 内 容 ，N 古 类 型 T 的 数据 类 型 长 
度 ， 这 将 可 能 导致 转换 结 采 与 输入 值 有 不 同 的 正 负 号 。 这 点 很 容易 理 
解 ， 因 为 原来 符号 位 处 于 数值 的 最 高 位 ， 高 位 被 丢弃 之 后 ， 转 换 结 
的 符号 束 取 决 于 低 N 个 字 节 的 首位 了 。 


在 将 一 个 浮 点 值 鹤 化 转换 为 整数 类 型 T 《IT 限于 int 或 long 类 型 之 
一 ) 的 时 候 ， 将 遵循 以 下 转换 规则 : 


如 果 浮 点 值 是 NaN， 那 转换 结 采 整 是 int 或 long 类 型 的 0 。 


如 有 果 浮 点 值 不 是 无 穷 大 的 话 ， 浮 点 值 使 用 IEEE 754 的 回 零 售 人 模 
式 取 整 ， 获 得 整数 值 v， 如 果 v 在 目标 类 型 T (int 或 long) 的 表示 范围 之 
内 ， 那 转换 结果 就 是 v。 


人 否则， 将 根据 v 的 符号 ， 转 换 为 T 所 能 表示 的 最 大 或 者 最 小 正 数 。 


从 double 类 型 到 float 类 型 的 罕 化 转换 过 程 与 IEEE 754 中 定义 的 一 
致 ， 通 过 IEEE 754 向 最 接近 数 合 入 模式 舍 入 得 到 一 个 可 以 使 用 float 类 
型 表示 的 数字 。 如 果 和 转换 结果 的 绝对 值 太 小 而 无 法 使 用 float 来 表示 的 
话 ， 将 返回 float 类 型 的 正 负 零 。 如 果 转 换 结果 的 绝对 值 太 大 而 无 法 使 
用 float 来 表示 的 话 ， 将 返回 float 类 型 的 正 负 无 穷 大 ， 对 于 double 类 型 的 
NaN 值 将 按 规定 转换 为 float 类 型 的 NaN 值 。 


管 数 据 类 型 鹤 化 转换 可 能 会 发 生 上 限 溢 出 、 下 限 溢出 和 精度 丢 
失 等 情况 ， 但 是 Java 虚 拟 机 规范 中 明确 规定 数值 类 型 的 罕 化 转换 指令 
永远 不 可 能 导致 虚拟 机 抛 出 运行 时 异 第 。 


6.4.5 “对象 创建 与 访问 指令 


虽然 类 实例 和 数组 都 是 对 象 ， 但 Java 虚 拟 机 对 类 实例 和 数组 的 创 
建 与 操作 使 用 了 不 同 的 字 节 码 指 令 (在 第 7 章 会 讲 到 数组 和 普通 类 的 类 
型 创建 过 程 是 不 同 的 ) 。 对 象 创建 后 ， 就 可 以 通过 对 和 象 访问 指令 获取 
对 象 实例 或 者 数组 实例 中 的 字段 或 者 数组 元 素 ， 这 些 指令 如 下 。 


创建 类 实例 的 指令 : new 。 


创建 数组 的 指令 : newarray 、anewarray 、multianewarray 。 


访问 类 字段 (static 字 段 ， 或 者 称 为 类 变量 ) 和 实例 字段 ( 非 static 
字段 ， 或 者 称 为 实例 变量 ) 的 指令 ;getfield 、putfield 、getstatic 、 


putstatic ° 


把 一 个 数组 元 素 加 载 到 操作 数 栈 的 指令 : baload、caload、 


saload 、iaload 、l]aload 、faload、daload 、aaload ° 


将 一 个 操作 数 栈 的 值 存储 到 数组 元 系 中 的 指令 : bastore、 


castore 、 sastore 、 iastore 、 fastore 、 dastore 、 aastore ° 


取 数 组 长 度 的 指令 : arraylength 。 


检查 类 实例 类 型 的 指令 :instanceof、checkcast。 


6.4.6 ”操作 数 栈 管理 指令 


如 同 操作 一 个 普通 数据 结构 中 的 堆栈 那样 ，Java 虚 拟 机 提供 了 一 
些 用 于 直接 操作 操作 数 栈 的 指令 ， 包 括 : 


将 操作 数 栈 的 栈 顶 一 个 或 两 个 元 素 出 栈 : pop、pop2。 


复制 栈 顶 一 个 或 两 个 数值 并 将 复制 值 或 双 份 的 复制 值 重新 压 入 栈 
顶 : dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2。 


将 栈 最 顶端 的 两 个 数值 互 换 : swap 。 


6.4.7 ”控制 转移 指令 


控制 转移 指令 可 以 让 Java 虚 拟 机 有 条 件 或 无 条 件 地 从 指定 的 位 置 
日 令 而 不 是 控制 转移 指令 的 下 一 条 指令 继续 执行 程序 ， 从 概念 模型 上 
理解 ， 可 以 认为 控制 黑 移 指令 就 是 在 有 条 件 或 无 条 件 地 修改 PC 寄存 郁 
的 值 。 控 制 转移 指令 如 下 。 


条 件 分 支 : ifeq 、iflt、ifle、ifne 、ifgt 、ifge 、ifnull 、ifnonnull 、 
if icmpeq ~ if icmpne ~ if icmplt 、 if icmpgt ~ if icmple ~、 iif icmpge 、 


计 _acmpeq 和 证 acmpne ° 

复合 条 件 分 支 : tableswitch 、lookupswitch 。 

无 条 件 分 支 : goto ~ goto w ~ Jsr 、 jsr w 、 ret° 

在 Java 虚 拟 机 中 有 专门 的 指令 集 用 来 处 理 int 和 reference 类 型 的 条 
件 分 文 比较 操作 ， 为 了 可 以 无 须 明 显 标识 一 个 实体 值 是 否 null， 也 有 
专门 的 指令 用 来 检测 null 值 。 

与 表面 算术 运算 时 的 规则 一 致 ， 对 于 boolean 类 型 、byte 类 型 、 
char 类 型 和 short 类 型 的 条 件 分 文 比 较 操 作 ， 都 是 使 用 int 类 型 的 比较 指 


令 来 完成 ， 而 对 于 long 类 型 、float 类 型 和 double 类 型 的 条 件 分 文 比 较 操 
作 ， 则 会 先 执行 相应 类 型 的 比较 运算 指令 《dcmpg、dcmpl、fcmpg、 


fcmpl、lcmp， 见 6.4.3 记 ) ， 运 算 指令 会 返回 一 个 整 型 值 到 操作 数 栈 
中 ， 随 后 再 执行 int 类 型 的 条 件 分 文 比较 操作 来 完成 整个 分 文 跳 转 。 由 
于 各 种 类 型 的 比较 最 终 都 会 转化 为 int 类 型 的 比较 操作 ，int 类 型 比较 是 
否 方便 完善 就 显得 尤为 重要 ， 所 以 Java 虚 拟 机 提供 的 int 类 型 的 条 件 分 
文 指令 是 最 为 丰富 和 强大 的 。 


6.4.8 ”方法 调用 和 返回 指令 
方法 调用 (分 派 、 执 行 过 程 ) 将 在 第 8 章 具体 讲解 ， 这 里 仅 列举 以 
下 5 条 用 于 方法 调用 的 指令 。 


invokevirtual 指 令 用 于 调用 对 和 象 的 实例 方法 ， 根 据 对 象 的 实际 类 型 
进行 分 派 〈 虚 方法 分 派 ) ， 这 也 是 Java 语 言 中 最 常见 的 方法 分 派 方 
式 o 


invokeinterface 指 令 用 于 调用 接口 方法 ， 它 会 在 运行 时 搜索 一 个 实 
现 了 这 个 接口 方法 的 对 象 ， 找 出 适合 的 方法 进行 调用 。 

invokespecial 指 令 用 于 调用 一 些 需 要 特殊 处 理 的 实例 方法 ， 包 括 实 
例 初 始 化 方法 、 私 有 方法 和 父 类 方法 。 

invokestatic 指 令 用 于 调用 类 方法 (static 方 法 ) 。 

invokedynamic 指 令 用 于 在 运行 时 动态 解析 出 调用 点 限定 符 所 引用 
的 方法 ， 并 执行 该 方法 ， 前 面 4 条 调用 指令 的 分 派 逻 辑 都 固化 在 Java 虚 
拟 机 内 部 ， 而 invokedynamic 指 令 的 分 派 逻 辑 是 由 用 户 所 设 定 的 引导 方 
法 决定 的 。 


方法 调用 指令 与 数据 类 型 无 关 ， 而 方法 返回 指令 是 根据 返回 值 的 
类 型 区 分 的 ， 包 括 ireturn 〈 当 返回 值 是 boolean、byte、char、short 和 int 
类 型 时 使 用 ) 、]return、freturn、dreturmm 和 areturn， 男 外 还 有 一 条 return 
指令 供 声 明 为 void 的 方法 、 实 例 初 始 化 方法 以 及 类 和 接口 的 类 初始 化 
方法 使 用 。 


6.4.9 ”异常 处 理 指令 


在 Java 程 序 中 显 式 抛 出 异常 的 操作 (throw 语 句 ) 都 由 athrow 指 令 
来 实现 ， 除 了 用 throw 语 句 显 式 抛 出 异常 情况 之 外 ，Java 虚 拟 机 规范 还 
规定 了 许多 运行 时 异常 会 在 其 他 Java 虚 拟 机 指令 检测 到 异常 状况 时 自 
动 抛 出 。 例 如 ， 在 前 面 介绍 的 整数 运算 中 ， 当 除数 为 零 时 ， 虚 拟 机 会 
在 idiv 或 ldiv 指 令 中 抛 出 ArithmeticException 异 常 。 


而 在 Java 虚 拟 机 中 ， 处 理 异常 (catch 语 句 ) 不 是 由 字 节 码 指令 来 
实现 的 (很 久之 前 曾经 使 用 jsr 和 和 ret 指令 来 实现 ， 现 在 已 经 不 用 了 ) ， 
而 是 采用 异常 表 来 完成 的 。 


6.4.10 ”同步 指令 


Java 虚 拟 机 可 以 文 持 方 法 级 的 同步 和 方法 内 部 一 段 指令 序列 的 同 
步 ， 这 两 种 同步 结构 都 是 使 用 管 程 (Monitor) 来 文 持 的 。 


方法 级 的 同步 是 隐 式 的 ， 即 无 须 通 过 字 节 码 指令 来 控制 ， 它 实现 
在 方法 调用 和 返回 操作 之 中 。 虚 拟 机 可 以 从 方法 常量 池 的 方法 表 结 构 
中 的 ACC_SYNCHRONIZED 访 问 标 志 得 知 一 个 方法 是 否 声 明 为 同步 方 
法 。 当 方法 调用 时 ， 调 用 指令 将 会 检查 方法 的 ACC_SYNCHRONIZED 
访问 标志 是 否 被 设置 ， 如 果 设 置 了 ， 执 行 线程 就 要 求 移 成 功 持 有 管 
程 ， 然 后 才能 执行 方法 ， 最 后 当 方 法 完成 (无论 是 正常 完成 还 是 非 正 
常 完成 ) 时 释放 管 程 。 在 方法 执行 期 间 ， 执 行 线程 持 有 了 管 程 ， 其 他 
任何 线程 都 无 法 再 获取 到 同一 个 管 程 。 如 有 果 一 个 同步 方法 执行 期 间 抛 
出 了 异常 ， 并 且 在 方法 内 部 无 法 处 理 此 异常 ， 那 么 这 个 同步 方法 所 持 
有 的 管 程 将 在 异常 抛 到 同步 方法 之 外 时 自动 释放 。 


同步 一 段 指 令 集 序列 通常 是 由 Java 语 言 中 的 synchronized 语 句 块 来 
表示 的 ，Java 庶 拟 机 的 指令 集中 有 monitorenter 和 monitorexit 两 条 指令 
来 文 持 synchronized 关 键 字 的 语义 ， 正 确实 现 synchronized 天 键 字 需 要 
Javac 编 译 右 与 Java 虚 拟 机 两 者 共同 协作 文 持 ， 壁 如 代码 清单 6-6 中 所 示 
的 代码 。 


代码 清单 6-6 ”代码 同步 演示 


void onlyMe (Foo f) { 
synchronized (f) { 
doSomething( ); 


} 


编译 后 ， 这 段 代 码 生 成 的 字 节 码 序列 如 下 : 


Method void onlyMe (Foo) 

0 aload_1// 将 对 象 f 入 栈 

1 dup// 复 制 栈 顶 元 素 ( 即 f 的 引用 ) 
2 astore_2// 将 栈 顶 元 素 存 储 到 局 部 变量 表 SLot 2 中 

3 monitorenter// 以 栈 顶 元 素 ( 即 f) 作为 锁 ， 开 始 同 

4 aload_0// 将 局 部 变量 Slot 9 ( 即 this 指 针 ) 的 元 素 入 栈 
5 

8 


NN 


invokevirtual#5// 调 用 doSomething( ) 方 法 
aload_2// 将 局 部 变量 Slow 2 的 元 素 ( 即 f) 入 栈 
9 monitorexit// 退 出 同步 
10 goto 18// 方 法 正常 结束 ， 跳 转 到 18 返 回 
13 astore_3// 从 这 步 开始 是 异常 路 径 ， 见 下 面 异 常 表 的 Taget 13 
14 aload_2// 将 局 部 变量 Slow 2 的 元 素 ( 即 f) 入 栈 
15 monitorexit// 退 出 同步 
16 aload_3// 将 局 部 变量 Slow 3 的 元 素 ( 即 异 常 对 象 ) 入 栈 
17 athrow// 把 异常 对 象 重新 抛 出 给 onlyMe( ) 方 法 的 调用 者 
18 return// 方 法 正常 返回 
Exception table: 
FromTo Target Type 
4 160 13 any 
13 16 13 any 


编译 闫 必须 确保 无 论 方法 通过 何 种 方式 完成 ， 方 法 中 调用 过 的 


条 monitorenter 指 令 都 必须 执行 其 对 应 的 monitorexit 指 令 ， 而 无 论 这 


方法 是 正常 结束 还 是 异常 结 


“ 


从 代码 清单 6-6 的 字 下 码 序列 中 可 以 看 到 ， 为 了 保证 在 方法 异常 完 
成 时 monitorenter 和 monitorexit 指 令 依然 可 以 正确 配对 执行 ， 编 译 絮 会 
目 动产 生 一 个 异常 处 理 器 ， 这 个 异常 处 理 器 声明 可 处 理 所 有 的 异常 
它 的 目的 就 是 用 来 执行 monitorexit 指 令 


6.5 公有 设计 和 私有 实现 


Java 虚 拟 机 规 艺 描绘 了 Java 虚 拟 机 应 有 的 共同 程序 存储 格式 : 
Class 文 件 格 式 以 及 字 闻 码 指令 集 。 这 些 内 容 与 硬件 、 操 作 系统 及 具体 
的 Java 虚 拟 机 实现 之 间 是 完全 独立 的 ， 虚 拟 机 实现 者 可 能 更 愿意 把 它 
们 看 做 是 程序 在 各 种 Java 平 台 实现 之 间 互 相安 全 地 交互 的 手段 。 


理解 公有 设计 与 私有 实现 之 间 的 分 界线 是 非常 有 必要 的 ，Java 虚 
拟 机 实现 必须 能 够 读 取 Class 文 件 并 精确 实现 包含 在 其 中 的 Java 虚 拟 机 
代码 的 语义 。 拿 着 Java 虚 拟 机 规范 一 成 不 变 地 逐 字 实现 其 中 要 求 的 内 
容 当 然 是 一 种 可 行 的 途径 ， 但 一 个 优秀 的 虚拟 机 实现 ， 在 满足 虚拟 机 
规范 的 约束 下 对 具体 实现 做 出 修改 和 优化 也 是 完全 可 行 的 ， 并 且 虚 拟 
机 规范 中 明确 鼓励 实现 者 这 样 做 。 只 要 优化 后 Class 文 件 依然 可 以 被 正 
确 读 取 ， 并 且 包 含 在 其 中 的 语义 能 得 到 完整 的 保持 ， 那 实现 者 就 可 以 
选择 任何 方式 去 实现 这 些 语义 ， 虚 拟 机 后 台 如 何 处 理 Class 文 件 完全 是 
实现 者 自己 的 事情 ， 只 要 它 在 外 部 接口 上 看 起 来 与 规范 描述 的 一 致 即 
可 上 。 


虚拟 机 实现 者 可 以 使 用 这 种 伸缩 性 来 让 Java 虚 拟 机 获得 更 高 的 性 
能 、 更 低 的 内 存 消 耗 或 者 更 好 的 可 移植 性 ， 选 择 哪 种 特性 取决 于 Java 


虚拟 机 实现 的 目标 和 关注 点 是 什么 。 虚 拟 机 实现 的 方式 主要 有 以 下 两 
种 : 


将 输入 的 Java 虚 拟 机 代码 在 加 载 或 执行 时 翻译 成 另外 一 种 虚拟 机 


将 输入 的 Java 虚 拟 机 代码 在 加 载 或 执行 时 翻译 成 宿主 机 CPU 的 本 
地 指令 集 〈 即 JIT 代 码 生 成 技术 ) 。 


精确 定义 的 虚拟 机 和 目标 文件 格式 不 应 当 对 虚拟 机 实现 者 的 创造 
性 产生 太 多 的 限制 ，Java 虚 拟 机 应 被 设计 成 可 以 允许 有 众多 不 同 的 实 
现 ， 并 且 各 种 实现 可 以 在 保持 兼容 性 的 同时 提供 不 同 的 、 新 的 、 有 趣 
的 解决 方案 。 


[1] 这 里 其 实 多 少 存在 一 些 例外 : 壁 如 调试 器 (Debuggers) 、 人 性 能 监视 
器 (Profilers) 和 即时 编译 器 (Just-In-Time Code Generator) 等 都 可 能 
需要 访问 一 些 通常 认为 是 “虚拟 机 后 台 ” 的 元 素 。 


6.6 ”Class 文 件 结构 的 发 展 


Class 文 件 结构 目 Java 虚 拟 机 规范 第 1 版 订立 以 来 ， 已 经 有 十 多 年 的 
历史 。 这 十 多 年 间 ，Java 技 术 体 系 有 了 翻天 和 窗 地 的 改变 ，JDK 的 版 本 
号 已 经 从 1.0 提 升天 了 1.7。 相 对 于 语言 、API 以 及 Java 技 术 体 系 中 其 他 
方面 的 变化 ，Class 文 件 结构 一 直 处 于 比较 稳定 的 状态 ，Class 文 件 的 主 
体 结构 、 字 节 码 指令 的 语义 和 数量 几乎 没有 出 现 过 变动 趾 ， 所 有 对 
Class 文 件 格式 的 改进 ， 都 集中 在 回访 问 标 志 、 属性 表 这 些 在 设计 上 束 
可 扩展 的 数据 结构 中 添加 内 容 。 


如 采 以 《Java 虚 拟 机 规范 〈 第 2 版 ) 》 为 基准 进行 比较 的 话 ， 那 么 
在 后 续 Class 文 件 格 式 的 发 展 过 程 中 ， 访 问 标 志 里 新 加 入 了 
ACC_SYNTHETIC ~、 ACC_ANNOTATION ~ ACC_ENUM、 


ACC_BRIDGE、ACC_VARARGS 共 5 个 标志 。 而 属性 表 集 合 中 ， 在 
JDK 1.5 到 JDK 1.7 版 本 之 间 一 共 增 加 了 12 项 新 的 属性 ， 这 些 属性 大 部 
分 用 于 支持 Java 中 许多 新 出 现 的 语言 特性 ， 如 枚 举 、 变 长 参数 、 汉 

型 、 动 态 注解 等 。 还 有 一 些 是 为 了 文 持 性 能 改进 和 调试 信息 ， 壁 如 
JDK 1.6 的 新 类 型 校 验 器 的 StackMapTable 属 性 和 对 韭 Java 代 码 调 试 中 用 
到 的 SourceDebugExtension 属 性 。 


Class 文 件 格式 所 具备 的 平台 中 立 (不 依赖 于 特定 硬件 及 操作 系 
统 ) 、 紧 凑 、 稳 定 和 可 扩展 的 特点 ， 征 Java 技 术 体 系 实现 平台 无 关 、 
语言 无 天 两 项 特性 的 重要 文 柱 。 


[十 余年 间 ， 字 节 码 的 数量 和 语义 只 发 生 过 屈指 可 数 的 几 次 变动 ， 例 
如 ，JDK1.0.2 时 改动 过 invokespecial 指 令 的 语义 ; JDK 1.7 增 加 了 


invokedynamic 指 令 ， 禁 止 了 ret 和 jsr 指 令 。 


6.7 ”本章 小 结 


Class 文 件 是 Java 虚 拟 机 执行 引擎 的 数据 入 口 ， 也 是 Java 技 术 体 系 
的 基础 构成 之 一 。 了 解 Class 文 件 的 结构 对 后 面 进 一 步 了 解 虚 拟 机 执行 
引擎 有 很 重要 的 意义 。 


本 章 详细 讲解 了 Class 文 件 结构 中 的 各 个 组 成 部 分 ， 以 及 每 个 部 分 
的 定义 、 数 据 结构 和 使 用 方法 。 通 过 代码 清单 6-1 的 Java 代 码 与 它 的 
Class 文 件 样 例 ， 以 实战 的 方式 演示 了 Class 的 数据 是 如 何 存储 和 访问 
的 。 从 第 7 草 开 始 ， 我 们 将 以 动态 的 、 运 行 时 的 角度 去 看 看 字 市 码 流 在 
虚拟 机 执行 引擎 中 古 怎 样 被 解释 执行 的 。 


第 7 章 ”虚拟 机 类 加 载 机 制 


代码 编译 的 结果 从 本 地 机 需 码 转变 为 字 节 码 ， 是 存储 格式 发 展 的 
一 小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


7.1 概述 


上 一 革 我 们 了 解 了 Class 文 件 存储 格式 的 具体 细 市 ， 在 Class 文 件 中 
描述 的 各 种 信息 ， 节 终 都 需要 加 载 到 虚拟 机 中 之 后 才能 运行 和 使 用 。 
而 虚拟 机 如 何 加 载 这 些 Class 文 件 ? Class 文 件 中 的 信息 进入 到 虚拟 机 后 
会 发 生 什 么 变化 ? 这 些 都 是 本 章 将 要 讲解 的 内 容 。 


虚拟 机 把 描述 类 的 数据 从 Class 文 件 加 载 到 内 存 ， 并 对 数据 进行 校 
验 、 转 换 解 析 和 初始 化 ， 最 终 形成 可 以 被 虚拟 机 直接 使 用 的 Java 类 
型 ， 这 就 是 虚拟 机 的 类 加 载 机 制 。 


与 那些 在 编译 时 需要 进行 连接 工作 的 语言 不 同 ， 在 Java 语 言 里 
面 ， 类 型 的 加 载 、 连 接 和 初始 化 过 程 都 古 在 程序 运行 期 间 完 成 的 ， 这 
种 策略 虽然 会 令 类 加 载 时 稍微 增加 一 些 性 能 开销 ， 但 是 会 为 Java 应 用 
程序 提供 高 度 的 灵活 性 ，Java 里 天 生 可 以 动态 扩展 的 语言 特性 就 是 依 
赖 运行 期 动态 加 载 和 动态 连接 这 个 特点 实现 的 。 例 如 ， 如 采编 写 一 个 
面 问 接口 的 应 用 程序 ， 可 以 等 到 运行 时 再 指定 其 实际 的 实现 类 ; 用 户 


可 以 通过 Java 预 定义 的 和 目 定 义 类 加 载 器 ， 让 一 个 本 地 的 应 用 程序 可 
以 在 运行 时 从 网 络 或 其 他 地 方 加 载 一 个 二 进 制 流 作 为 程序 代码 的 一 部 
分 ， 这 种 组 装 应 用 程序 的 方式 目前 已 广泛 应 用 于 Java 程 序 之 中 。 从 最 
基础 的 Applet、JSP 到 相对 复杂 的 OSGi 技 术 ， 都 使 用 了 Java 语 言 运行 期 
类 加 载 的 特性 。 


为 了 避免 语言 表达 中 可 能 产生 的 偏差 ， 在 本 划 正 式 开 始 之 前 ， 笔 
者 先 设 立 两 个 语言 上 的 约定 : 第 一 ， 在 实际 情况 中 ， 每 个 Class 文 件 都 
有 可 能 代表 着 Java 语 言 中 的 一 个 类 或 接口 ， 后 文中 直接 对 “类 ”的 摘 述 
都 包括 了 类 和 接口 的 可 能 性 ， 而 对 于 类 和 接口 需要 分 开 描述 的 场景 会 
特别 指明 ; 第 二 ， 与 前 面 介 绍 Class 文 件 格式 时 的 约定 一 致 ， 笔 者 本 章 
所 提 到 的 “Class 文 件 ” 并 非特 指 某 个 存在 于 具体 人 磁盘 中 的 文件 ， 这 里 所 
说 的 “Class 文 件 ” 应 当 是 一 串 二 进 制 的 字 节 流 ， 无 论 以 何 种 形式 存在 都 
可 以 。 


7.2 ”类 加 载 的 时 机 


类 从 被 加 载 到 虚拟 机 内 存 中 开始 ， 到 和 扼 载 出 内 存 为 止 ， 它 的 整个 
生命 周期 包括 : 加 载 (Loading) 、 验 证 (Verification) 、 准 备 
(Preparation) 、 解 析 (Resolution) 、 初 始 化 (Initialization) 、 使 用 
Using) 和 弧 载 (Unloading) 7 个 阶段 。 其 中 验证 、 准 备 、 解 析 3 个 
分 统称 为 连接 (Linking) ， 这 7 个 阶段 的 发 生 顺 序 如 图 7-1 所 示 。 


加 载 
Loading 


(U 
部 


连接 (Linking ) 


准备 解析 
Preparation Resolution 


7-1 类 的 生命 周期 


图 7-1 中 ， 加 载 、 验 证 、 准 备 、 初 始 化 和 番 载 这 5 个 阶段 的 顺序 是 
确定 的 ， 类 的 加 载 过 程 必须 按照 这 种 顺序 按部就班 地 开始 ， 而 解析 阶 
段 则 不 一 定 : 它 在 某 些 情况 下 可 以 在 初始 化 阶段 之 后 再 开始 ， 这 是 为 
了 支持 Java 语 言 的 运行 时 绑 定 〈 也 称 为 动态 绑 定 或 晚期 绑 定 ) 。 注 
意 ， 这 里 笔者 写 的 是 按 部 束 班 地 “开始 ”， 而 不 是 按 部 殉 班 地 “ 进 


行 ?或 “完成 ”， 强 调 这 点 是 因为 这 些 阶 段 通 前 都 是 互相 交叉 地 混合 式 进 
行 的 ， 通 常会 在 一 个 阶段 执行 的 过 程 中 调用 、 油 活 男 外 一 个 阶段 。 


什么 情况 下 需要 开始 类 加 载 过 程 的 第 一 个 阶段 : 加 载 ? Java 虚 拟 
机 规范 中 并 没有 进行 强制 约束 ， 这 点 可 以 交 给 虚拟 机 的 具体 实现 来 目 
由 把 握 。 但 是 对 于 初始 化 阶段 ， 虚 拟 机 规范 则 是 严格 规定 了 有 且 只 有 5 
种 情况 必须 立即 对 类 进行 “初始 化 ”〈 而 加 载 、 验 证 、 准 备 自然 需要 在 
此 之 前 开始 ) : 


1) 遇 到 new、getstatic、putstatic 或 invokestatic 这 4 条 字 节 码 指令 
时 ， 如 果 类 没有 进行 过 初始 化 ， 则 需要 先 触发 其 初始 化 。 生 成 这 4 条 指 
令 的 最 常见 的 Java 代 码 场 景 是 ， 使 用 new 关 键 字 实例 化 对 象 的 时 候 、 读 
取 或 设置 一 个 类 的 静态 字段 (被 final 修 饰 、 已 在 编译 期 把 结果 放 入 常 
量 池 的 静态 字段 除外 ) 的 时 候 ， 以 及 调用 一 个 类 的 静态 方法 的 时 候 。 


2) 使 用 java.lang.reflect 包 的 方法 对 类 进行 反射 调用 的 时 候 ， 如 果 
类 没有 进行 过 初始 化 ， 则 需要 先 触发 其 初始 化 。 

3) 当初 始 化 一 个 类 的 时 候 ， 如 果 发 现 其 父 类 还 没有 进行 过 初始 
化 ， 则 需要 先 触发 其 父 类 的 初始 化 。 


4) 当 虚 拟 机 启动 时 ， 用 户 需 要 指定 一 个 要 执行 的 主 类 (包含 
main() 方 法 的 那个 类 ) ， 虚 拟 机 会 先 初始 化 这 个 主 类 。 


5) 当 使 用 JDK 1.7 的 动态 语言 支持 时 ， 如 果 一 个 
java.lang.invoke.MethodHandle 实 例 最 后 的 解析 结果 REF_getStatic 、 
REF_putStatic、REF _invokeStatic 的 方法 句柄 ， 并 且 这 个 方法 句柄 所 对 
应 的 类 没有 进行 过 初始 化 ， 则 需要 先 触发 其 初始 化 。 


对 于 这 5 种 会 触发 类 进行 初始 化 的 场景 ， 虚 拟 机 规范 中 使 用 了 一 个 
很 强烈 的 限定 语 : “有 且 只 有 ”， 这 5 种 场景 中 的 行为 称 为 对 一 个 类 进行 
主动 引用 。 除 此 之 外 ， 所 有 引用 类 的 方式 都 不 会 触发 初始 化 ， 称 为 被 
动 引 用 。 下 面 举 3 个 例子 来 说 明 何 为 被 动 引 用 ， 分 别 见 代码 清单 7-1~ 代 
码 清单 7-3。 


代码 清单 7-1 被 动 引 用 的 例子 之 一 


package org.fenixsoft.classloading:; 
De 


* 被 动 使 用 类 字段 演示 一 : 

通过 子 类 引用 父 类 的 静态 字段 ， 不 会 导致 子 类 初始 化 
yA 

public class SuperClasst{ 

statict{ 

System.out.println ("SuperClass init! ") ; 


* 


public static int value=123; 


public class SubClass extends SuperClasst{ 
statict{ 

System.out.println ("SubClass init! ") ; 

} 


} 

A 党 

* 非 主动 使 用 类 字段 演示 

* *:/ 

public class NotInitializationf{ 

public static void main (String[]args) { 


System.out.println (SubClass.value) ; 


} 


上 述 代码 运行 之 后 ， 只 会 输出 "SuperClass init! "， 而 不 会 输 
出 "SubClass init! "。 对 于 静态 字段 ， 只 有 直接 定义 这 个 字段 的 类 才 会 
被 初始 化 ， 因 此 通过 其 子 类 来 引用 父 类 中 定义 的 静态 字段 ， 只 会 触发 
父 类 的 初始 化 而 不 会 触发 子 类 的 初始 化 。 至 于 是 否 要 触发 子 类 的 加 载 
和 验证 ， 在 虚拟 机 规范 中 并 未 明确 规定 ， 这 点 取决 于 虚拟 机 的 具体 实 
现 。 对 于 Sun HotSpot 虚 拟 机 来 说 ， 可 通过 -XX:+TraceClassLoading 参 数 
观察 到 此 操作 会 导致 子 类 的 加 载 。 


代码 清单 7-2 被动 引 用 的 例子 之 二 


package org.fenixsoft.classloading:; 

/* * 

* 被 动 使 用 类 字段 演示 二 : 

通过 数组 定义 来 引用 类 ， 不 会 触发 此 类 的 初始 化 

* yh 

public class NotInitializationf{ 

public static void main (String[]args) { 
SuperClass[]sca=new SuperClass[10]:; 


} 


+ 


为 了 节省 版 面 ， 这 段 代 码 复 用 了 代码 清单 7-1 中 的 SuperClass， 运 
行 之 后 发 现 没 有 输出 "SuperClass init! "， 说 明 并 没有 触发 类 
org.fenixsoft.classloading.SuperClass 的 初始 化 阶段 。 但 是 这 段 代 码 里 面 
触发 了 另外 一 个 名 为 "[Lorg.fenixsoft.classloading.SuperClass" 的 类 的 初 


人 化 阶段 ， 对 于 用 户 代 码 来 说 ， 这 并 不 是 一 个 合法 的 类 名 称 ， 它 是 一 
个 由 虚拟 机 目 动 生 成 的 、 直接 继承 于 java.lang.Object 的 子 类 ， 创 建 动 
作 由 字 市 码 指 令 newarray 触 发 。 


这 个 类 代表 了 一 个 元 素 类 型 为 org.fenixsoft.classloading.SuperClass 
的 一 维 数 组 ， 数 组 中 应 有 的 属性 和 方法 (用 户 可 直接 使 用 的 只 有 被 修 
饰 为 public 的 length 属 性 和 clone() 方 法 ， 都 实现 在 这 个 类 里 。Java 语 言 
中 对 数组 的 访问 比 C/C++ 相 对 安全 是 因为 这 个 类 封装 了 数组 元 素 的 访 
问 方 法 趾 ， 而 C/C++ 直接 翻译 为 对 数组 指针 的 移动 。 在 Java 语 言 中 ， 当 
检查 到 发 生 数组 越界 时 会 抛 出 
java.lang.ArrayIndexOutOfBoundsException 异 常 。 


代码 清单 7-3 ”被 动 引用 的 例子 之 三 


package org.fenixsoft.classloading:; 

pA 

* 被 动 使 用 类 字段 演示 三 : 

* 常 量 在 编译 阶段 会 存 入 调用 类 的 常量 池 中 ， 本 质 上 并 没有 直接 引用 到 定义 常量 的 类 ， 
此 不 会 触发 定义 常量 的 类 的 初始 化 。 


Ba 


public class ConstClasst{ 
statict{ 
System.out.println ("ConstClass init! "). 


} 
public static final String HELLOWORLD="hello world"; 


} 

/A** 

* 非 主动 使 用 类 字段 演示 

Sa. 

public class NotInitializationf{ 

public static void main (String[]args) { 
System.out.println (ConstClass .HELLOWORLD) ; 


} 


上 述 代 码 运行 之 后 ， 也 没有 输出 "ConstClass init! "， 这 是 因为 虽 
然 在 Java 源 码 中 引用 了 ConstClass 类 中 的 常量 HELLOWORLD， 但 其 实 
在 编译 阶段 通过 常量 传播 优化 ， 已 经 将 此 常量 的 值 "hello world" 存 储 到 
了 NotInitialization 类 的 沼 量 池 中 ， 以 后 NotInitialization 对 和 常量 


ConstClass.HELLOWORLD 的 引用 实际 都 被 转化 为 NotInitialization 类 对 
自身 常量 池 的 引用 了 “。 也 就 是 说 ， 实 际 上 NotInitialization 的 Class 文 件 
之 中 并 没有 ConstClass 类 的 符号 引用 入 口 ， 这 两 个 类 在 编译 成 Class 之 
后 就 不 存在 任何 联系 了 。 


接口 的 加 载 过 程 与 类 加 载 过 程 稍 有 一 些 不 同 ， 针 对 接口 需要 做 一 
些 特殊 说 明 : 接口 也 有 初始 化 过 程 ， 这 点 与 类 是 一 致 的 ， 上 面 的 代码 
都 是 用 静态 语句 块 "static{}" 来 输出 初始 化 信息 的 ， 而 接口 中 不 能 使 
用 "static{}" 语 句 块 ， 但 编译 絮 仍 然 会 为 接口 生成 "< clinit > 0" 类 构造 妖 
由 ， 用 于 初始 化 接口 中 所 定义 的 成 员 变 量 。 接 口 与 类 真正 有 所 区 别 的 
是 前 面 讲述 的 5 种 “有 且 仅 有 ”需要 开始 初始 化 场景 中 的 第 3 种 : 当 一 个 
类 在 初始 化 时 ， 要 求 其 父 类 全 部 都 已 经 初始 化 过 了 ， 但 是 一 个 接口 在 
初始 化 时 ， 并 不 要 求 其 父 接 口 全 部 都 完成 了 初始 化 ， 只 有 在 真正 使 用 
到 父 接口 的 时 候 (如 引用 接口 中 定义 的 常量 ) 才 会 初始 化 。 


[准确 地 说 ， 越 界 检查 不 是 封闭 在 数组 元 素 访 问 的 类 中 ， 而 是 封装 在 


数组 访问 的 xaload、xastore 字 六 人 码 指 令 中 。 


[2] 关 于 类 构造 器 < dlinit> 和 方法 构造 器 <init> 的 生成 过 程 和 作用 ， 
可 参见 第 10 章 的 相关 内 容 。 


7.3 ”类 加 载 的 过 程 


接 下 来 我 们 评 细 讲解 一 下 Java 虚 拟 机 中 类 加 载 的 全 过 程 ， 也 就 古 
加 载 、 验 证 、 准 备 、 解 析 和 初始 化 这 5 个 阶段 所 执行 的 具体 动作 。 


7.3.1 ”加 载 
“加 载 * 是 “类 加 载 ” (Class Loading) 过 程 的 一 个 阶段 ， 希 望 读 者 没 


有 混 消 这 两 个 看 起 来 很 相似 的 名 词 。 在 加 载 阶段 ， 虚 拟 机 需要 完成 以 
下 3 件 事 情 : 


1) 通过 一 个 类 的 全 限定 名 来 获取 定义 此 类 的 二 进 制 字 市 流 。 


2) 将 这 个 字 流 所 代表 的 静态 存储 结构 转化 为 方法 区 的 运行 时 数 
据 结构 。 


3) 在 内 存 中 生成 一 个 代表 这 个 类 的 java.lang.Class 对 象 ， 作 为 方 
法 区 这 个 类 的 各 种 数据 的 访问 入 口 。 


虚拟 机 规范 的 这 3 点 要 求 其 实 并 不 算 具 体 ， 因 此 虚拟 机 实现 与 具体 
应 用 的 灵活 度 都 是 相当 大 的 。 例 如 “通过 一 个 类 的 全 限定 名 来 获取 定义 
此 类 的 二 进 制 字 市 流 ” 这 条 ， 它 没有 指明 二 进 制 字 市 流 要 从 一 个 Class 
文件 中 获取 ， 准 确 地 说 是 根本 没有 指明 要 从 哪里 获取 、 怎样 获取 。 虚 


拟 机 设计 团队 在 加 载 阶段 搭建 了 一 个 相当 开放 的 、 广 阔 的 “舞台 ”， 
Java 发 展 历程 中 ， 充 满 创 造 力 的 开发 人 员 则 在 这 个 “ 舞 合 ”上 玩 出 了 各 
种 花样 ， 许 多 举足轻重 的 Java 技 术 都 建立 在 这 一 基础 之 上 ， 例 如 : 


从 ZIP 包 中 读 取 ， 这 很 常见 ， 最 终 成 为 日 后 JAR、EAR、WAR 格 式 
的 基础 。 


从 网 络 中 获取 ， 这 种 场景 最 典型 的 应 用 束 是 Applet 。 


运行 时 计算 生成 ， 这 种 场景 使 用 得 最 多 的 就 是 动态 代理 技术 ， 在 
java.lang.reflect.Proxy 中 ， 就 是 用 了 ProxyGenerator.generateProxyClass 
来 为 特定 接口 生成 形式 为 "*$Proxy" 的 代理 类 的 二 进 制 字 太 流 。 


由 其 他 文件 生成 ， 典 型 场景 是 JSP 应 用 ， 即 由 JSP 文 件 生成 对 应 的 
Class 类 。 


从 数据 库 中 读 取 ， 这 种 场景 相对 少见 些 ， 例 如 有 些 中 则 件 服务 妖 
(如 SAP Netweaver) 可 以 选择 把 程序 安装 到 数据 库 中 来 完成 程序 代码 
在 集群 间 的 分 发 。 
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相对 于 类 加 载 过 程 的 其 他 阶段 ， 一 个 非 数组 类 的 加 载 阶段 (准确 
地 说 ， 是 加 载 阶段 中 获取 类 的 二 进 制 字 市 流 的 动作 ) 是 开发 人 员 可 控 
性 最 强 的 ， 因 为 加 载 阶段 既 可 以 使 用 系统 提供 的 引导 类 加 载 右 来 完 


成 ， 也 可 以 由 用 户 自 定义 的 类 加 载 器 去 完成 ， 开 发 人 员 可 以 通过 定义 
自己 的 类 加 载 器 去 控制 字 节 流 的 获取 方式 ( 即 重 写 一 个 类 加 载 器 的 
loadClass(0) 方 法 ) 。 


对 于 数组 类 而 言 ， 情 况 束 有 所 不 同 ， 数 组 类 本 身 不 通过 类 加 载 圳 
创建 ， 它 是 由 Java 虚 拟 机 直接 创建 的 。 但 数组 类 与 类 加 载 套 仍然 有 很 
密切 的 关系 ， 因 为 数组 类 的 元 素 类 型 (Element Type， 指 的 是 数组 去 
掉 所 有 维度 的 类 型 ) 最终 是 要 靠 类 加 载 器 去 创建 ， 一 个 数组 类 (下 面 
简称 为 C) 创建 过 程 束 遵 循 以 下 规则 : 


如 果 数 组 的 组 件 类 型 (Component Type， 指 的 是 数组 去 掉 一 个 维 
度 的 类 型 ) 是 引用 类 型 ， 那 就 递归 采用 本 万 中 定义 的 加 载 过程 去 加 载 
这 个 组 件 类 型 ， 数 组 C 将 在 加 载 该 组 件 类 型 的 类 加 载 器 的 类 名 称 空间 
上 被 标识 (这 点 很 重要 ， 在 7.4 节 会 介绍 到 ， 一 个 类 必须 与 类 加 载 器 一 
起 确定 唯一 性 ) 。 


如 果 数 组 的 组 件 类 型 不 是 引用 类 型 (例如 int[] 数 组 ，，Java 虚 拟 机 
将 会 把 数组 C 标 记 为 与 引导 类 加 载 器 关联 。 


数组 类 的 可 见 性 与 它 的 组 件 类 型 的 可 见 性 一 致 ， 如 果 组 件 类 型 不 
征 引 用 类 型 ， 那 数组 类 的 可 见 性 将 默认 为 public。 


关于 类 加 载 器 的 话题 ， 笔 者 将 在 本 章 的 7.4 节 专门 讲述 。 


加 载 阶段 完成 后 ， 虚 拟 机 外 部 的 二 进 制 字 节 流 就 按照 虚拟 机 所 需 
的 格式 存储 在 方法 区 之 中 ， 方 法 区 中 的 数据 存储 格式 由 虚拟 机 实现 目 
行 定 义 ， 虚 拟 机 规范 未 规定 此 区 域 的 具体 数据 结构 。 人 然后 在 内 存 中 实 
例 化 一 个 java.lang.Class 类 的 对 象 (并 没有 明确 规定 是 在 Java 堆 中 ， 对 
于 HotSpot 虚 拟 机 而 言 ，Class 对 象 比 较 特殊 ， 它 虽然 是 对 象 ， 但 是 存放 
在 方法 区 里 面 ) ， 这 个 对 象 将 作为 程序 访问 方法 区 中 的 这 些 类 型 数据 
的 外 部 接口 。 


加 载 阶段 与 连接 阶段 的 部 分 内 容 (如 一 部 分 字 节 码 文 件 格式 验证 
动作 ) 是 交叉 进行 的 ， 加 载 阶 段 尚 未 完成 ， 连 接 阶 段 可 能 已 经 开始 ， 
但 这 些 夹 在 加 载 阶段 之 中 进行 的 动作 ， 仍 然 属于 连接 阶段 的 内 容 ， 这 
两 个 阶段 的 开始 时 间 仍 然 保持 着 固定 的 先后 顺序 。 
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证 是 连接 阶段 的 第 一 步 ， 这 一 阶段 的 目的 是 为 了 确保 Class 文 件 
的 字 节 流 中 包含 的 信息 符合 当前 虚拟 机 的 要 求 ， 并 且 不 会 危害 虚拟 机 
目 身 的 安全 。 


Java 语 言 本 里 是 相对 安全 的 语言 (依然 是 相对 于 C/C++ 来 说 ， 使 
用 纯粹 的 Java 代 码 无 法 做 到 诸如 访问 数组 边界 以 外 的 数据 、 将 一 个 对 
象 转型 为 它 并 未 实现 的 类 型 、 跳 转 到 不 存在 的 代码 行 之 类 的 事情 ， 如 
果 这 样 做 了 ， 编 译 右 将 拒绝 编译 。 但 前 面 已 经 说 过 ，Class 文 件 并 不 一 
定 要 求 用 Java 源 码 编译 而 来 ， 可 以 使 用 任何 途径 产生 ， 甚 至 包括 用 十 
六 进 制 编辑 絮 直 接 编 写 来 产生 Class 文 件 。 在 字 广 码 语言 层面 上 ， 上 壕 
Java 代 码 无 法 做 到 的 事情 都 是 可 以 实现 的 ， 至 少 语义 上 是 可 以 表达 出 
来 的 。 虚 拟 机 如 来 不 检查 输入 的 字 市 流 ， 对 其 完全 信任 的 话 ， 很 可 能 
会 因为 载 入 了 有 害 的 字 市 流 而 导致 系统 朋 涡 ， 所 以 验证 是 虚拟 机 对 目 
身 保护 的 一 项 重要 工作 。 


验证 阶段 是 非常 重要 的 ， 这 个 阶段 是 否 挛 运 ， 直 接 决 定 了 Java 虚 
拟 机 是否 能 承受 恶意 代码 的 攻击 ， 从 执行 性 能 的 角度 上 讲 ， 验 证 阶段 
的 工作 量 在 虚拟 机 的 类 加 载 子 系统 中 又 占 了 相当 大 的 一 部 分 。 《Java 
虚拟 机 规范 (第 2 版 ，》 对 这 个 阶段 的 限制 、 指 导 还 是 比较 笼统 的 ， 规 


范 中 列举 了 一 些 Class 文 件 格 式 中 的 静态 和 结构 化 约束 ， 如 果 验 证 到 输 
入 的 字 市 流 不 符合 Class 文 件 格 式 的 约束 ， 虚 拟 机 就 应 抛 出 一 个 
java.lang.VerifyError 寞 常 或 其 子 类 异常 ， 但 具体 应 当 检 查 哪 些 方面 ， 如 
何 检查 ， 何 时 检查 ， 都 没有 足够 具体 的 要 求 和 明确 的 说 明 。 直 到 2011 
年 发 布 的 《Java 虚 拟 机 规范 (Java SE 7 版 ) 》， 大 幅 增加 了 描述 验证 
过 程 的 篇 幅 〈 从 不 到 10 页 增加 到 130 页 ) ， 这 时 约束 和 验证 规则 才 变 得 
具体 起 来 。 受 篇 幅 所 限 ， 本 书 无 法 逐条 规则 去 讲解 ， 但 从 整体 上 看 ， 
验证 阶段 大 致 上 会 完成 下 面 4 个 阶段 的 检验 动作 : 文件 格式 验证 、 元 数 
据 验证 、 字 节 码 验证 、 符 号 引用 验证 。 


1. 文 件 格 式 验 证 


第 一 阶段 要 验证 字 蔬 流 是 否 符合 Class 文 件 格 式 的 规范 ， 并 且 能 被 
当前 版 本 的 虚拟 机 处 理 。 这 一 阶段 可 能 包括 下 面 这 些 验 证 点 : 


是 否 以 魔 数 0xXCAFEBABE 开 头 。 


主 、 次 版 本 号 是 否 在 当前 虚拟 机 处 理 范 围 之 内 。 


常量 池 的 常量 中 是 否 有 不 被 文 持 的 常量 类 型 (检查 常量 tag 标 


et 
3 


指 癌 和 常量 的 各 种 索引 值 中 是 否 有 指 同 不 存在 的 常量 或 不 符合 类 型 


的 常量 。 


CONSTANT_Utf8_info 型 的 常量 中 是 否 有 不 符合 UTF8 编 码 的 数 
据 。 


Class 文 件 中 各 个 部 分 及 文件 本 喘 是 否 有 人 锐 删 除 的 或 附加 的 其 他 信 


ee ee 


实际 上 ， 第 一 阶段 的 验证 点 还 远 不 止 这 些 ， 上 面 这 些 只 是 从 
HotSpot 虚 拟 机 源码 趾 中 摘抄 的 一 小 部 分 内 容 ， 该 验证 阶段 的 主要 目的 
征 保 证 输入 的 字 世 流 能 正确 地 解析 并 存储 于 方法 区 之 内 ， 格 式 上 符合 
描述 一 个 Java 类 型 信息 的 有 要求 。 这 阶段 的 验证 是 基于 二 进 制 字 节 流 进 
行 的 ， 只 有 通过 了 这 个 阶段 的 验证 后 ， 字 市 流 才 会 进入 内 存 的 方法 区 
中 进行 存储 ， 所 以 后 面 的 3 个 验证 阶段 全 部 是 基于 方法 区 的 存储 结构 进 
行 的 ， 不 会 再 直接 操作 字 节 流 。 


2. 元 数据 验证 


二 阶段 是 对 字 市 码 描述 的 信息 进行 语义 分 析 ， 以 人 证 其 描述 的 


第 二 
信息 符合 Java 语 言 规范 的 要 求 ， 这 个 阶段 可 能 包括 的 验证 点 如 下 : 


这 个 类 是 否 有 父 类 (除了 java.lang.Object 之 外 ， 所 有 的 类 都 应 当 
有 父 天 )* 


这 个 类 的 父 类 是 否 继承 了 不 允许 被 继承 的 类 (被 final 修 饰 的 
2 


如 果 这 个 类 不 是 抽象 类 ， 是 否 实现 了 其 父 类 或 接口 之 中 要 求实 现 
的 所 有 方法 。 


类 中 的 字段 、 方 法 是 否 与 父 类 产生 矛盾 (例如 禾 盖 了 父 类 的 final 
字段 ， 或 者 出 现 不 符合 规则 的 方法 重 载 ， 例 如 方法 参数 都 一 致 ， 但 返 
回 值 类 型 却 不 同等 ) 。 
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第 二 阶段 的 主要 目的 古 对 类 的 元 数据 信息 进行 语义 校 验 ， 保 证 不 


存在 不 符合 Java 语 言 规范 的 元 数据 信息 。 


3. 字 世人 码 难 证 


第 三 阶段 是 整个 验证 过 程 中 最 复杂 的 一 个 阶段 ， 主 要 目的 是 通过 
数据 流 和 控制 流 分 析 ， 确 定 程 序 语义 是 合法 的 、 符 合 逻 辑 的 。 在 第 二 
阶段 对 元 数据 信息 中 的 数据 类 型 做 完 校 验 后 ， 这 个 阶段 将 对 类 的 方法 
体 进行 校 验 分 析 ， 保 证 个 校 验 类 的 方法 在 运行 时 不 会 做 出 危害 虚拟 机 
安全 的 事件 ， 例 如 : 


保证 任意 时 刻 操 作 数 栈 的 数据 类 型 与 指令 代码 序列 都 能 配合 工 
作 ， 例 如 不 会 出 现 类 似 这 样 的 情况 : 在 操作 栈 放置 了 一 个 int 类 型 的 数 


据 ， 使 用 时 却 按 long 类 型 来 加 载 入 本 地 变量 表 中 。 
傈 证 跳 转 指令 不 会 跳 转 到 方法 体 以 外 的 子 节 码 指 令 上 。 


保证 方法 体 中 的 类 型 转换 是 有 效 的 ， 例 如 可 以 把 一 个 子 类 对 象 赋 
值 给 父 类 数据 类 型 ， 这 是 安全 的 ,但 是 把 父 类 对 象 赋值 给 子 类 数据 类 
型 ， 甚 至 把 对 象 赋值 给 与 它 蝇 无 继承 关系 、 完 全 不 相干 的 一 个 数据 类 
型 ， 则 是 危险 和 不 合法 的 。 
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如 果 一 个 类 方法 体 的 字 市 码 没有 通过 子 节 人 码 验 证 ， 那 肯定 是 有 问 
题 的 ， 但 如 有 果 一 个 方法 体 通 过 了 字 市 码 验证 ， 也 不 能 说 明 其 一 定 束 是 
安全 的 。 即 使 字 市 码 验 证 之 中 进行 了 大 量 的 检查 ， 也 不 能 保证 这 一 
点 。 这 里 涉及 了 离散 数学 中 一 个 很 著名 的 问题 "Halting Problem" 2 : 通 
俗 一 点 的 说 法 束 是 ， 通 过 程序 去 校 验 程序 逻辑 是 无 法 做 到 绝对 准确 的 
不 能 通过 程序 准确 地 检查 出 程序 是 否 能 在 有 限 的 时 间 之 内 结束 运 


由 于 数据 流 验 证 的 高 复杂 性 ， 虚 拟 机 设计 团队 为 了 避免 过 多 的 时 
间 消 耗 在 字 节 码 验证 阶段 ， 在 JDK 1.6 之 后 的 Javac 编 译 器 和 Java 虚 拟 机 
中 进行 了 一 项 优化 ， 给 方法 体 的 Code 属 性 的 属性 表 中 增加 了 一 项 名 
为 "StackMapTable" 的 属性 ， 这 项 属性 搬 述 了 方法 体 中 所 有 的 基本 块 
(Basic Block， 按 照 控 制 流 拆 分 的 代码 块 ) 开始 时 本 地 变量 表 和 操作 


栈 应 有 的 状态 ， 在 字 广 码 验 证 期 间 ， 束 不 需要 根据 程序 推导 这 些 状态 
的 合法 性 ， 只 需要 检查 StackMapTable 属 性 中 的 记录 是 否 合 法 即 可 。 这 
样 将 字 广 码 验 证 的 类 型 推导 转变 为 类 型 检查 从 而 节省 一 些 时 间 。 


理论 上 StackMapTable 属 性 也 存在 错误 或 被 咎 改 的 可 能 ， 所 以 是 否 
有 可 能 在 恶意 自 改 了 Code 属 性 的 同时 ， 也 生成 相应 的 StackMapTable 属 
性 来 骗 过 虚拟 机 的 类 型 校 验 则 是 虚拟 机 设计 者 值得 思考 的 问题 。 


在 JDK 1.6 的 HotSpot 虚 拟 机 中 提供 了 -XX:-UseSplitVerifier 选 项 来 
关闭 这 项 优化 ， 或 者 使 用 参数 -XX:+FailOverToOldVerifier 要 求 在 类 型 
校 验 失 败 的 时 候 退 回 到 旧 的 类 型 推导 方式 进行 校 验 。 而 在 JDK 1.7 之 
后 ， 对 于 主 版 本 号 大 于 50 的 Class 文 件 ， 使 用 类 型 检查 来 完成 数据 流 分 
析 校 验 则 是 唯一 的 选择 ， 不 允许 再 退回 到 类 型 推导 的 校 验 方式 。 


4. 从 号 引用 验证 


最 后 一 个 阶段 的 校 验 发 生 在 虚拟 机 将 符号 引用 转化 为 直接 引用 的 
时 候 ， 这 个 转化 动作 将 在 连接 的 第 三 阶段 一 一 解析 阶段 中 发 生 。 符 号 
引用 验证 可 以 看 做 是 对 类 上 自身 以 外 (常量 池 中 的 各 种 符号 引用 ) 的 信 
尽 进 行 匹配 性 校 验 ， 通 常 需 要 校 验 下 列 内 容 : 


符号 引用 中 通过 字符 串 摘 述 的 全 限定 名 征 否 能 找到 对 应 的 类 。 


在 指定 类 中 征 否 存在 符合 方法 的 字段 摘 述 符 以 及 简单 名 称 所 摘 述 
的 方法 和 字段 。 


符号 引用 中 的 类 、 字 段 、 方 法 的 访问 性 (private、protected、 
public、default) 是 否 可 被 当前 类 访问 。 


ee 


符号 引用 验证 的 目的 是 确保 解析 动作 能 正常 执行 ， 如 采 无 法 通过 
符号 引用 验证 ， 那 么 将 会 抛 出 一 个 
java.lang.IncompatibleClassChangeError 寞 第 的 了 于 类 ， 如 
java.lang.IegalAccessEIrTrOT、java.lang.NoSuchFieldError、 


java.lang.NoSuchMethodError 等 。 


对 于 虚拟 机 的 类 加 载 机 制 来 说 ， 验 证 阶段 是 一 个 非常 重要 的 、 但 
不 是 一 定 必要 (因为 对 程序 运行 期 没有 影响 ) 的 阶段 。 如 果 所 运行 的 
全 部 代码 (包括 自己 编写 的 及 第 三 方 包 中 的 代码 ) 都 已 经 被 反复 使 用 
和 验证 过 ， 那 么 在 实施 阶段 束 可 以 考虑 使 用 -Xverify:none 参 数 来 天 闭 
大 部 分 的 类 验证 措施 ， 以 缩短 虚拟 机 类 加 载 的 时 间 。 


[1] 源 码 位 置 : hotspot\src\share\vmNclassfile\classFileParser.cpp。 

[2] 停 机 问题 惑 是 判断 任意 一 个 程序 是 否 会 在 有 限 的 时 间 之 内 结束 运行 
的 问题 。 如 果 这 个 问题 可 以 在 有 限 的 时 间 之 内 解决 ， 可 以 有 一 个 程序 
判断 其 本 身 是 否 会 停机 并 做 出 相反 的 行为 。 这 时 候 显 然 不 管 停机 问题 


的 结果 是 什么 都 不 会 符合 要 求 ， 所 以 这 是 一 个 不 可 解 的 问题 。 有 具体 的 
证 明 过 程 可 参考 : http:/zh.wikipedia.org/zh/ 停 机 问题 。 
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准备 阶段 是 正式 为 类 变量 分 本 内存 并 设置 类 变量 初始 值 的 阶段 ， 
变量 所 使 用 的 内 存 都 将 在 方法 区 中 进行 分 配 。 这 个 阶段 中 有 两 个 
生 混 消 的 概念 需要 强调 一 下 ， 首 爷 ， 这 时 候 进行 内 存 分 配 的 仅 
括 类 变量 (被 static 修 饰 的 变量 ) ， 而 不 包括 实例 变量 ， 实 例 变 量 将 
怎 对象 实例 化 时 随 痢 对 象 一 起 分 配 在 Java 堆 中 。 其 次 ， 这 里 所 说 的 初 
通 利 情况 "下 是 数据 类 型 的 零 值 ， 假 设 一 个 类 变量 的 定义 为 : 


了 泛 
lss 
六 


从 冰 也 
可 时 
E 


public static int value=123; 


那 变量 value 在 准备 阶段 过 后 的 初始 值 为 0 而 不 是 123， 因 为 这 时 候 
尚未 开始 执行 任何 Java 方 法 ， 而 把 value 赋 值 为 123 的 putstatic 指 令 是 程序 
被 编译 后 ， 存 放 于 类 构造 器 < clinit> () 方 法 之 中 ， 所 以 把 value 赋 值 为 
123 的 动作 将 在 初始 化 阶段 才 会 执行 。 表 7-1 列 出 了 Java 中 所 有 基本 数据 
类 型 的 零 值 。 


表 7-1 基本 数据 类 型 的 零 值 


数据 类 型 零 值 数据 类 型 零 值 
int 0 boolean false 


long 0L float 0.0f 
short (Short 0 double 0.0d 


char \u0000" reference null 


byte (byte) 0 


上 面 所 到， 在 “ 通 前 情况 ”下 初始 值 是 零 值 ， 那 相对 的 会 有 一 些 “ 特 
殊 情 况 ”， 如 采 类 字段 的 字段 属性 表 中 存在 ConstantValue 属 性 ， 那 在 准 
备 阶 段 变量 value 就 会 被 初始 化 为 ConstantValue 属 性 所 指定 的 值 ， 假 设 
上 面 类 变量 value 的 定义 变 为 : 


public static final int Value=123; 


编译 时 Javac 将 会 为 value 生 成 ConstantValue 属 性 ， 在 准备 阶段 虚拟 
机 豆 会 根据 ConstantValue 的 设置 将 value 赋 值 为 123。 


7.3.4 解析 


解析 阶段 是 虚拟 机 将 常量 池内 的 符号 引用 替换 为 直接 引用 的 过 
程 ， 符 号 引用 在 前 一 章 讲解 Class 文 件 格式 的 时 候 已 经 出 现 过 多 次 ， 在 
Class 文 件 中 它 以 CONSTANT _Class_info、CONSTANT Fieldref info、 
CONSTANT_Methodref_info 等 类 型 的 常量 出 现 ， 那 解析 阶段 中 所 说 的 
直接 引用 与 符号 引用 又 有 什么 关联 呢 ? 


符号 引用 (Symbolic References) : 符号 引用 以 一 组 符号 来 描述 所 
引用 的 目标 ， 符 号 可 以 是 任何 形式 的 字面 量 ， 只 要 使 用 时 能 无 收 义 地 
定位 到 目标 即 可 。 符 号 引用 与 虚拟 机 实现 的 内 存 布局 无 天 ，3 引 用 的 目 
标 并 不 一 定 已 经 加 载 到 内 存 中 。 各 种 虚拟 机 实现 的 内 存 布局 可 以 各 不 
相同 ， 但 是 筷 们 能 接受 的 符号 引用 必须 都 是 一 致 的 ， 因 为 符 吕 引用 的 
字面 量 形式 明确 定义 在 Java 虚 拟 机 规范 的 Class 文 件 格 式 中 。 


直接 引用 (Direct References) : 直接 引用 可 以 是 直接 指向 目标 的 
指针 、 相 对 偏 移 量 或 古 一 个 能 间接 定位 到 目标 的 句柄 。 直 接 引 用 是 和 
虚拟 机 实现 的 内 存 布局 相关 的 ， 同 一 个 符号 引用 在 不 同 虚拟 机 实例 上 
翻译 出 来 的 直接 引用 一 般 不 会 相同 。 如 条 有 了 直接 引用 ， 那 引用 的 目 
标 必 定 已 经 在 内 存 中 存在 。 


虚拟 机 规范 之 中 并 未 规定 解析 阶段 发 生 的 具体 时 间 ， 只 要 求 了 在 
执行 anewarray、checkcast、getfield 、getstatic、instanceof 、 
invokedynamic 、 invokeinterface 、 invokespecial 、 invokestatic 、 
invokevirtual ~ ldc 、 ldc_w 、 multianewarray 、 new 、 putfield 和 putstaticiX 
16 个 用 于 操作 符号 引用 的 字 市 码 指 令 之 前 ， 先 对 它们 所 使 用 的 符号 引 
用 进行 解析 。 所 以 虚拟 机 实现 可 以 根据 需要 来 判断 到 的 十 在 类 倍加 载 
妖 加 载 时 就 对 肖 量 池 中 的 符号 引用 进行 解析 ， 还 是 等 到 一 个 符号 引用 
将 要 被 使 用 前 才 去 解析 它 。 


对 同一 个 符号 引用 进行 多 次 解析 请 求 是 很 常见 的 事情 ， 除 
invokedynamic 指 令 以 外 ， 虚 拟 机 实现 可 以 对 第 一 次 解析 的 结果 进行 绥 
存 (在 运行 时 常量 池 中 记录 直接 引用 ， 并 把 常量 标识 为 已 解析 状态 ) 
从 而 避免 解析 动作 重复 进行 。 无 论 是 否 真 正 执行 了 多 次 解析 动作 ， 虚 
拟 机 需要 保证 的 是 在 同一 个 实体 中 ， 如 果 一 个 符号 引用 之 前 已 经 被 成 
劝解 机 过， 那么 后 续 的 引用 解析 请 求 吏 应 当 一 直 成 功 ; 同样 的 ， 如 采 
第 一 次 解析 失败 了 ， 那 么 其 他 指令 对 这 个 符号 的 解析 请 求 也 应 该 收 到 
相同 的 异常 。 


对 于 invokedynamic 指 令 ， 上 面 规则 则 不 成 立 。 当 碰 到 某 个 前 面 已 
经 由 invokedynamic 指 令 触发 过 解析 的 符号 引用 时 ， 并 不 意味 着 这 个 解 
析 结 有 末 对 于 其 他 invokedynamic 指 令 也 同样 生效 。 因 为 invokedynamic 指 
令 的 目的 本 来 就 是 用 于 动态 语言 支持 (目前 仅 使 用 Java 语 言 不 会 生成 


这 条 字 市 码 指令 ) ， 它 所 对 应 的 引用 称 为 “动态 调用 点 限定 

符 ”(Dynamic Call Site Specifier) ， 这 里 “动态 ”的 含义 就 是 必须 等 到 
程序 实际 运行 到 这 条 指令 的 时 候 ， 解 析 动 作 才 能 进行 。 相 对 的 ， 其 余 
可 触发 解析 的 指令 都 是 “静态 ”的 ， 可 以 在 刚刚 完成 加 载 阶段 ， 还 没有 
开始 执行 代码 时 就 进行 解析 。 


解析 动作 主要 针对 类 或 接口 、 字 段 、 类 方法 、 接 口 方 法 、 方 法 类 
型 、 方 法 句柄 和 调用 点 限定 符 7 类 符号 引用 进行 ， 分别 对 应 于 常量 池 的 
CONSTANT_Class_info ~、 CONSTANT_Fieldref info、 


CONSTANT_ Methodref info ~、 CONSTANT_ InterfaceMethodref info、 
CONSTANT_MethodType_info 、 CONSTANT MethodHandle info 和 
CONSTANT_InvokeDynamic_info 7 种 常量 类 型 1。 下 面 将 讲解 前 面 4 种 
引用 的 解析 过 程 ， 对 于 后 面 3 种 ， 与 JDK 1.7 新 增 的 动态 语言 文 持 姑 轧 
相关 ， 由 于 Java 语 言 是 一 门 静 态 类 型 语言 ， 因 此 在 没有 介绍 
invokedynamic 指 令 的 语义 之 前 ， 没 有 办 法 将 它们 和 现在 的 Java 语 言 对 
应 上 ， 笔 者 将 在 第 8 章 介 绍 动态 语言 调用 时 一 起 分 析 讲 解 。 


1. 类 或 接口 的 解析 


假设 当前 代码 所 处 的 类 为 D， 如 果 要 把 一 个 从 未 解析 过 的 符号 引 
用 N 解 析 为 一 个 类 或 接口 C 的 直接 引用 ， 那 虚拟 机 完成 整个 解析 的 过 程 
需要 以 下 3 个 步 又 


1) 如 果 C 不 是 一 个 数组 类 型 ， 那 虚拟 机 将 会 把 代表 N 的 全 限定 名 
传递 给 D 的 类 加 载 右 去 加 载 这 个 类 C。 在 加 载 过 程 中 ， 由 于 元 数据 验 
证 、 字 市 码 验 证 的 需要 ， 又 可 能 触发 其 他 相关 类 的 加 载 动 作 ， 例 如 加 
载 这 个 类 的 父 类 或 实现 的 接口 。 一 旦 这 个 加 载 过 程 出 现 了 任何 异常， 
解析 过 程 束 是 告 失 败 。 


2) 如 果 C 是 一 个 数组 类 型 ， 并 且 数 组 的 元 素 类 型 为 对 象 ， 也 就 是 
N 的 描述 符 会 是 类 似 "[Ljava/lang/Integer" 的 形式 ， 那 将 会 按照 第 1 点 的 
规则 加 载 数组 元 素 类 型 。 如 果 N 的 描述 符 如 前 面 所 假设 的 形式 ， 需 要 
加 载 的 元 素 类 型 就 是 "java.lang.Integer"， 接 着 由 虚拟 机 生成 一 个 代表 此 
数组 维度 和 元 素 的 数组 对 象 。 


3) 如 果 上 面 的 步骤 没有 出 现任 何 异常 ， 那 么 C 在 虚拟 机 中 实际 上 
已 经 成 为 一 个 有 效 的 类 或 接口 了 ， 但 在 解析 完成 之 前 还 要 进行 符号 引 
用 验证 ， 确 认 D 是 否 具备 对 C 的 访问 权限 。 如 果 发 现 不 具备 访问 权限 ， 
将 抛 出 java.lang.IllegalAccessError 异 常 。 


2. 字 段 解析 


要 解析 一 个 未 被 解析 过 的 字段 符号 引用 ， 首 先 将 会 对 字段 表 内 
class_indexL” | 项 中 索引 的 CONSTANT_Class_info 符 号 引用 进行 解析 ， 
也 就 是 字段 所 属 的 类 或 接口 的 符号 引用 。 如 果 在 解析 这 个 类 或 接口 符 
号 引用 的 过 程 中 出 现 了 任何 异常 ， 都 会 导致 字段 符号 引用 解析 的 失 


败 。 如 末 解 析 成 功 完成 ， 那 将 这 个 字段 所 属 的 类 或 接口 用 C 表 示 ， 虚 
拟 机 规范 要 求 按照 如 下 步 又 对 C 进 行 后 续 子 段 的 搜索 。 


1) 如 果 C 本 喘 就 包含 了 简单 名 称 和 字段 描述 符 都 与 目标 相 匹 配 的 
字段 ， 则 返回 这 个 字段 的 直接 引用 ， 查 找 结束 。 


2) 和 否则， 如果 在 C 中 实现 了 接口 ， 将 会 按照 继承 关系 从 下 往 上 递 
归 搜 索 各 个 接口 和 它 的 父 接口 ， 如 果 接 口中 包含 了 简单 名 称 和 字段 描 
述 符 都 与 目标 相 匹 配 的 字段 ， 则 返回 这 个 字段 的 直接 引用 ， 碍 找 结 
束 。 

3) 否则 ， 如 果 C 不 是 java.lang.Object 的 话 ， 将 会 按照 继承 关系 从 
下 往 上 递归 搜索 其 父 类 ， 如 果 在 父 类 中 包含 了 简单 名 称 和 字段 描述 符 
都 与 目标 相 匹配 的 字段 ， 则 返回 这 个 字段 的 直接 引用 ， 查 找 结束 。 


4) 和 否则， 查找 失败 ， 抛 出 java.lang.NoSuchFieldError 腊 常 。 


如 采 碍 找 过 程 成 功 返 回 了 引用 ， 将 会 对 这 个 字段 进行 权限 验证 ， 
如 果 发 现 不 具备 对 字段 的 访问 权限 ， 将 抛 出 java.lang.IlegalAccessError 
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在 实际 应 用 中 ， 虚 拟 机 的 编译 器 实现 可 能 会 比 上 壕 规 范 要 求 得 更 
加 严格 一 些 ， 如 采 有 一 个 同名 字段 同时 出 现在 C 的 接口 和 父 类 中 ， 或 
者 同时 在 目 己 或 父 类 的 多 个 接口 中 出 现 ， 那 编译 需 将 可 能 拒绝 编译 。 


在 代码 清单 7-4 中 ， 如 果 注 释 了 Sub 类 中 的 "public static int A=4; "， 接 
口 与 父 类 同时 存在 字段 A， 那 编译 磊 将 提示 "The field Sub.A is 
ambiguous"， 并 且 拒 绝 编译 这 段 代 码 。 


代码 清单 7-4 字段 解析 


package org.fenixsoft.classloading:; 
public class FieldResolutionf{ 
interface InterfaceOf{ 

int A=0; 


interface Interface1 extends InterfaceO{ 
int A=1; 


interface Interface2{ 

int A=2; 

} 

static class Parent implements Interfacel1f{ 
public static int A=3; 

} 


static class Sub extends Parent implements Interface21{ 
public static int A=4; 


public static void main (String[]Jargs) { 
System.out.println (Sub.A) ; 


} 
} 


3. 关 方法 解析 


类 方法 解析 的 第 一 个 步骤 与 字段 解析 一 样 ， 也 需要 和 允 解 析出 类 方 
法 表 的 class_index0 项 中 索引 的 方法 所 属 的 类 或 接口 的 符号 引用 ， 如 
果 解 析 成 功 ， 我 们 依然 用 C 表 示 这 个 类 ， 接 下 来 虚拟 机 将 会 按照 如 下 
步骤 进行 后 续 的 类 方法 搜索 。 


1) 类 方法 和 接口 方法 符号 引用 的 常量 类 型 定义 是 分 开 的 ， 如 果 在 
类 方法 表 中 发 现 class_index 中 索引 的 C 是 个 接口 ， 那 就 直接 抛 出 


java.lang.IncompatibleClassChangeError 寞 党 。 

2) 如 果 通 过 了 第 1 步 ， 在 类 C 中 查找 是 否 有 人 简单 名 称 和 描述 符 都 
与 日 标 相 匹配 的 方法 ， 如 果 有 则 返回 这 个 方法 的 直接 引用 ， 查 找 结 
束 。 


3) 否则 ， 在 类 C 的 父 类 中 递归 查找 是 否 有 简单 名 称 和 描述 符 都 与 
目标 相 匹 配 的 方法 ， 如 条 有 则 返回 这 个 方法 的 直接 引用 ， 碍 找 结 束 。 


4) 否则 ， 在 类 C 实 现 的 接口 列表 及 它们 的 父 接口 之 中 递归 查找 是 
人 否 有 人 简单 名 称 和 摘 述 符 都 与 目标 相 匹 配 的 方法 ， 如 采 存 在 匹配 的 方 
法 ， 说 明 类 C 征 一 个 抽象 类 ， 这 时 碍 找 结束 ， 抛 出 


java.lang.AbstractMethodError 异 常 。 


5) 否则 ， 宣 告 方法 查找 失败 ， 抛 出 
java.lang.NoSuchMethodError ° 

最 后 ， 如 果 查 找 过 程 成 功 返 回 了 直接 引用 ， 将 会 对 这 个 方法 进行 
权限 验证 ， 如 果 发 现 不 具备 对 此 方法 的 访问 权限 ， 将 抛 出 


java.lang.IllegalAccessError 异 常 。 


4. 接 口 方法 解析 


接口 方法 也 需要 先 解析 出 接口 方法 表 的 class_indexl 人 项 中 索引 的 
方法 所 属 的 类 或 接口 的 符号 引用 ， 如 果 解 析 成 功 ， 依 然 用 C 表 示 这 个 
接口 ， 接 下 来 虚拟 机 将 会 按照 如 下 步骤 进行 后 续 的 接口 方法 搜索 。 


1) 与 类 方法 解析 不 同 ， 如 果 在 接口 方法 表 中 发 现 class_index 中 的 
索引 C 是 个 类 而 不 是 接口 ， 那 就 直接 抛 出 


java.lang.IncompatibleClassChangeError 寞 党 。 


2) 否则 ， 在 接口 C 中 查找 是 否 有 位 单 名 称 和 描述 符 都 与 目标 相 匹 
配 的 方法 ， 如 果 有 则 返回 这 个 方法 的 直接 引用 ， 碍 找 结束 。 

3) 否则 ， 在 接口 C 的 父 接口 中 递归 查找 ， 直 到 java.lang.Object 类 
(查找 范围 会 包括 Object 类 ) 为 止 ， 看 是 否 有 简单 名 称 和 描述 符 都 与 
目标 相 人 匹配 的 方法 ， 如 果 有 则 返回 这 个 方法 的 直接 引用 ， 查 找 结束 。 


4) 否则 ， 宣 告 方法 查找 失败 ， 抛 出 java.lang.NoSuchMethodError 
异 蜗 。 

由 于 接口 中 的 所 有 方法 默认 都 是 public 的 ， 所 以 不 存在 访问 权限 的 
问题 ， 因 此 接口 方法 的 符号 解析 应 当 不 会 抛 出 


java.lang.lllegalAccessError 寞 弟 。 


[1] 严格 来 说 ， CONSTANT String info 和 


CONSTANT _InterfaceMethodref info 这 两 种 类 型 的 常量 也 有 解析 过 


程 ， 但 很 简单 、 直 观 ， 不 再 做 单独 介绍 。 

[2] 参 见 第 6 章 中 关于 CONSTANT_Fieldref_info 常 量 的 内 容 。 

[3] 参 见 第 6 章 关 于 CONSTANT_Methodref_info 常 量 的 内 容 。 

[4] 参 见 第 6 章 中 天 于 CONSTANT_InterfaceMethodref_info 常 量 的 内 容 。 


7.3.5 初始 化 


类 初始 化 阶段 是 类 加 载 过 程 的 最 后 一 步 ， 前 面 的 类 加 载 过 程 中 ， 
除了 在 加 载 阶段 用 户 应 用 程序 可 以 通过 目 定 义 类 加 载 右 参与 之 外 ， 其 
余 动作 完全 由 虚拟 机 主导 和 控制 。 到 了 初始 化 阶段 ， 才 真正 开始 执行 
类 中 定义 的 Java 程 序 代 码 《或 者 说 是 字 节 和 码 ) 。 


在 准备 阶段 ， 变 量 已 经 赋 过 一 次 系统 要 求 的 初始 值 ， 而 在 初始 化 
阶段 ， 则 根据 程序 员 通 过 程序 制定 的 主观 计划 去 初始 化 类 变量 和 其 他 
资源 ， 或 者 可 以 从 另外 一 个 角度 来 表达 : 初始 化 阶段 是 执行 类 构造 器 
<clinit> () 方 法 的 过 程 。 我 们 在 下 文 会 讲解 <clinit > () 方 法 是 怎么 生成 
的 ， 在 这 里 ， 我 们 先 看 一 下 < clinit> () 方 法 执行 过 程 中 一 些 可 能 会 影 
响 程 序 运行 行为 的 特点 和 细节 ， 这 部 分 相对 更 贴近 于 普通 的 程序 开发 


人 员 [ 。 


<clinit > (方法 是 由 编译 亏 目 动 收集 类 中 的 所 有 类 变量 的 赋值 动 
作 和 静态 语句 块 (static{} 块 ;中 的 语句 合并 产生 的 ， 编 译 锋 收集 的 顺 
序 古 由 语句 在 源 文件 中 出 现 的 顺序 所 决定 的 ， 静 态 语 句 块 中 只 能 访问 
到 定义 在 静态 语句 块 之 前 的 变量 ， 定 义 在 它 之 后 的 变量 ， 在 前 面 的 静 
人 态 语句 块 可 以 赋值 ， 但 是 不 能 访问 ， 如 代码 清单 7-5 中 的 例子 所 示 。 


代码 清单 7-5 ”非法 向 前 引用 变量 


public class Testt{ 

statict{ 

i=0.; // 给 变量 赋值 可 以 正常 编译 通过 

System.out.print (i) ; // 这 句 编 译 器 会 提示 "非法 向 前 引用 
} 

static int i=1; 


} 


<clinit > (方法 与 类 的 构造 函数 (或 者 说 实例 构造 器 <init>0 方 
法 ) 不 同 ， 它 不 需要 显 式 地 调用 父 类 构造 器 ， 虚 拟 机 会 保证 在 子 类 的 
<clinit > 0 方法 执行 之 前 ， 父 类 的 <dinit> 0 方法 已 经 执行 完毕 。 因 此 
在 虚拟 机 中 第 一 个 被 执行 的 < clinit> 0 方法 的 类 肯定 是 


java.lang.Object ° 


由 于 父 类 的 <clinit> 0) 方法 先 执 行 ， 也 融 意 味 着 父 类 中 定义 的 静 
人 态 语句 块 要 优先 于 子 类 的 变量 赂 值 操 作 ， 如 在 代码 清单 7-6 中 ， 字 上 段 B 


的 值 将 会 是 2 而 不 是 1。 
代码 清单 7-6< clinit > () 方 法 执行 顺序 


static class Parent{ 
public static int A=1.; 
statict{ 

A=2; 


static class Sub extends Parentt{ 
public static int B=A; 


public static void main (String[]args) { 
System.out.println (Sub.B) ; 


<clinit> () 方 法 对 于 类 或 接口 来 说 并 不 是 必需 的 ， 如 果 一 个 类 中 
没有 静态 语句 块 ， 也 没有 对 变量 的 赋值 操作 ， 那 么 编译 需 可 以 不 为 这 
个 类 和 后 成 <clinit> (0) 方 法。 


接口 中 不 能 使 用 静态 语句 块 ， 但 仍然 有 变量 初始 化 的 赋值 操作 ， 
因此 接口 与 类 一 样 都 会 生成 < clinit> () 方 法 。 但 接口 与 类 不 同 的 是 ， 
执行 接口 的 <clinit > (方法 不 需要 先 执行 父 接口 的 <clinit> 0 方法。 只 
有 当 父 接口 中 定义 的 变量 使 用 时 ， 父 接口 才 会 初始 化 。 另 外 ， 接 口 的 
实现 类 在 初始 化 时 也 一 样 不 会 执行 接口 的 <clinit> () 方 法 。 


虚拟 机 会 保证 一 个 类 的 <clinit> 0 方法 在 多 线程 环境 中 被 正确 地 
加 锁 、 同 步 ， 如 果 多 个 线程 同时 去 初始 化 一 个 类 ， 那 么 只 会 有 一 个 线 
程 去 执行 这 个 类 的 < dinit>0 方 法， 其 他 线程 都 需要 阻塞 等 待 ， 直 到 
活动 线程 执行 <clinit > 0 方法 完毕 。 如 果 在 一 个 类 的 < dlinit> (方法 中 
有 耗 时 很 长 的 操作 ， 就 可 能 造成 多 个 进程 阻塞 !， 在 实际 应 用 中 这 种 
阻塞 往往 是 很 隐蔽 的 。 代 码 清 单 7-7 演 示 了 这 种 场景 。 


代码 清单 7-7 字段 解析 


static class DeadLoopClasst{ 

statict{ 

/* 如 果 不 加 上 这 个 if 语 句 ， 编 译 器 将 提示 "Initializer does not complete 
normally" 并 拒绝 编译 */ 

if (true) { 

System.out.println (Thread.currentThread()+"init 
DeadLoopClass") ; 

while (true) { 

} 


} 

} 

public static void main (String[]args) { 

Runnable script=new Runnable()t{ 

public void run()t{ 

System.out.println (Thread.currentThread()+"start") ; 
DeadLoopClass dlc=new DeadLoopClass(); 
System.out.println (Thread.currentThread()+"run over") 


} 


}; 

Thread thread1=new Thread (script) ; 
Thread thread2=new Thread (script) ; 
thread1. start(); 

thread2. start(); 

} 


运行 结果 如 下 ， 即 一 条 线程 在 死 循环 以 模拟 长 时 间 操 作 ， 另 外 一 
条 线程 在 阻塞 等 待 。 
Thread[Thread-0，5，main]start 


Thread[Thread-1, 5, main]start 
Thread[Thread-0, 5, main]init DeadLoopClass 


[1] 这 里 只 限于 Java 语 言 编 译 产 生 的 Class 文 件 ， 并 不 包括 其 他 JVM 语 
[2] 需 要 注意 的 是 ， 其 他 线程 虽然 会 被 阻塞 ， 但 如 果 执 行 <clinit > (0) 方 
法 的 那 条 线程 退出 <clinit> 0) 方 法 后 ， 其 他 线程 唤醒 之 后 不 会 再 次 进 
入 <clinit> (0) 方 法 。 同 一 个 类 加 载 堪 下 ， 一 个 类 型 只 会 初始 化 一 次 。 


7.4 类 加 载 货 


虚拟 机 设计 团队 把 类 加 载 阶段 中 的 “通过 一 个 类 的 全 限定 名 来 获取 
描述 此 类 的 二 进 制 字 下 流 ” 这 个 动作 放 到 Java 虚 拟 机 外 部 去 实现 ， 以 便 
让 应 用 程序 目 己 决定 如 何 去 获 取 所 需要 的 类 。 实 现 这 个 动作 的 代码 模 
块 称 为 “类 加 载 器 ”。 


类 加 载 絮 可 以 说 是 Java 语 言 的 一 项 创新 ， 也 是 Java 语 言 流行 的 重 
要 原因 之 一 ， 它 最 初 是 为 了 满足 Java Applet 的 需求 而 开发 出 来 的 。 虽 
然 目 前 Java Applet 技 术 基 本 上 已 经 “ 死 掉 ”， 但 类 加 载 器 却 在 类 层次 划 
分 、OSGi、 热 部 署 、 代 码 加 密 等 领域 大 放 异 彩 ， 成 为 了 Java 拉 术 体 系 
中 一 块 重要 的 基石 ， 可 谓 是 失 之 桑 榆 ， 收 之 东 隅 。 


741 类 与 类 加 慌 表 


类 加 载 右 虽然 只 用 于 实现 类 的 加 载 动 作 ， 但 它 在 Java 程 序 中 起 到 
的 作用 却 远 远 不 限于 类 加 载 阶 段 。 对 于 任意 一 个 类 ， 都 需要 由 加 载 它 
的 类 加 载 器 和 这 个 类 本 号 一 同 确立 其 在 Java 虚 拟 机 中 的 唯一 性 ， 每 一 
个 类 加 载 磊 ， 都 拥有 一 个 独立 的 类 名 称 空间 。 这 人 句 话 可 以 表达 得 更 通 
俗 一 些 ， 比 较 两 个 类 是 否 “ 相 等 ”只 有 在 这 两 个 类 是 由 同一 个 类 加 载 
妖 加 载 的 前 提 下 才 有 意义 ， 否 则 ， 即 使 这 两 个 类 来 源 于 同一 个 Class 文 


件 ， 被 同一 个 虚拟 机 加 载 ， 只 要 加 载 它 们 的 类 加 载 器 不 同 ， 那 这 两 个 
类 就 必定 不 相等 。 


这 里 所 指 的 “相等 ”， 包 括 代 表 类 的 Class 对 象 的 equals() 方 法 、 
isAssignableFrom() 方 法 、isInstance() 方 法 的 返回 结果 ， 也 包括 使 用 
instanceof 天 键 字 做 对 象 所 属 关 系 判 定 等 情况 。 如 有 果 没 有 注意 到 类 加 载 
器 的 影响 ， 在 某 些 情况 下 可 能 会 产生 具有 迷惑 性 的 结果 ， 代 码 清 单 7-8 
中 演示 了 不 同 的 类 加 载 器 对 instanceof 关 键 字 运算 的 结果 的 影响 。 


代码 清单 7-8 不 同 的 类 加 载 器 对 instanceof 关 键 字 运算 的 结果 的 影 
员 


/A 
* 类 加 载 器 与 instanceof 关 键 字 演示 


*@author zzm 

*/ 

public class ClassLoaderTest{ 

public static void main (String[]args) throws Exceptiont{ 

ClassLoader myLoader=new ClassLoader(){ 

Q@Override 

public Class<?>1oadClass (String name) throws 
ClassNotFoundExceptiont{ 

try{ 

String fileName=name.substring (name.lastIndexof (".") 
+1) +".class"; 

InputStream is=getclass().getResourceAsStream (fileName) ; 

if (is==null) { 

return super.loadClass (name) ; 

} 

byte[]jb=new byte[is.available( )]:; 

is.read (b) ; 

return defineClass (name,b, 0, b.length) ; 

}catch (IOException e) { 

throw new ClassNotFoundException (name) : 


} 
} 


}; 
Object obj=myLoader .loadClass 
("org.fenixsoft.classloading.classLoaderTest") .newInstance(); 
System.out.println (obj.getClass()) ; 
System,.out.println (obj instanceof 
org.fenixsoft.classloading.ClassLoaderTest) ! 


} 
} 
运行 结 采 : 


class org.fenixsoft.classloading.ClassLoaderTest 
false 


代码 清单 7-8 中 构造 了 一 个 简单 的 类 加 载 器 ， 尽 管 很 简单 ， 但 是 对 
于 这 个 演示 来 说 还 是 够 用 了 。 它 可 以 加 载 与 自己 在 同一 路 径 下 的 Class 
文件 。 我 们 使 用 这 个 类 加 载 器 去 加 载 了 一 个 名 
为 "org.fenixsoft.classloading.ClassLoaderTest" 的 类 ， 并 实例 化 了 这 个 类 
的 对 象 。 两 行 输出 结果 中 ， 从 第 一 句 可 以 看 出 ， 这 个 对 象 确 实 是 类 
org.fenixsoft.classloading.ClassLoaderTest 实 例 化 出 来 的 对 象 ， 但 从 第 二 
句 可 以 发 现 ， 这 个 对 象 与 类 org .fenixsoft.classloading.ClassLoaderTest 做 
所 属 类 型 检查 的 时 候 却 返回 了 false， 这 是 因为 虚拟 机 中 存在 了 两 个 
ClassLoaderTest 类 ， 一 个 是 由 系统 应 用 程序 类 加 载 器 加 载 的 ， 另 外 一 
个 是 由 我 们 自 定 义 的 类 加 载 器 加 载 的 ， 虽 然 都 来 自 同 一 个 Class 文 件 ， 
但 依然 是 两 个 独立 的 类 ， 做 对 象 所 属 类 型 检查 时 结果 上 自然 为 false。 


[1] 特 指 浏 览 器 上 的 Java Applets ， 在 其 他 领域 ， 如 智能 卡 上 ，Java 
Applets 仍 然 有 广阔 的 市 场 。 


7.4.2 ”双亲 委派 模型 


从 Java 虚 拟 机 的 角度 来 讲 ， 只 存在 两 种 不 同 的 类 加 载 器 : 一 种 是 
启动 类 加 载 器 (Bootstrap ClassLoader) ， 这 个 类 加 载 器 使 用 C++ 语 言 
实现 踢 ， 是 虚拟 机 自身 的 一 部 分 ， 另 一 种 就 是 所 有 其 他 的 类 加 载 器 ， 
这 些 类 加 载 器 都 由 Java 语 言 实现 ， 独 立 于 虚拟 机 外 部 ， 并 且 全 都 继承 
自 抽象 类 java.lang.ClassLoader 。 


从 Java 开 发 人 员 的 角度 来 看 ， 类 加 载 套 还 可 以 划分 得 更 细致 一 
些 ， 绝 大 部 分 Java 程 序 都 会 使 用 到 以 下 3 种 系统 提供 的 类 加 载 右 。 


> 


启动 类 加 载 器 (Bootstrap ClassLoader) : 前 面 已 经 介绍 过 ， 这 
类 将 器 负责 将 存放 在 <JAVA_HOME > lib 目 录 中 的 ， 或 者 被 - 
Xbootclasspath 参 数 所 指定 的 路 径 中 的 ， 并 且 是 虚拟 机 识别 的 〈 仅 按照 
文件 名 识别 ， 如 rtjar， 和 名 字 不 符合 的 类 库 即使 放 在 lib 目 录 中 也 不 会 被 
加 载 ) 类 库 加 载 到 虚拟 机 内 存 中 。 启 动 类 加 载 器 无 法 被 Java 程 序 直接 
引用 ， 用 户 在 编写 自 定义 类 加 载 器 时 ， 如 果 需 要 把 加 载 请 求 委 派 给 引 
导 类 加 载 器 ， 那 直接 使 用 null 代 替 即 可 ， 如 代码 清单 7-9 所 示 为 
java.lang.ClassLoader.getClassLoader() 方 法 的 代码 片段 。 


代码 清单 7-9 ”ClassLoader.getClassLoader() 方 法 的 代码 片段 


Returns the class loader for the class.Some Implementations may 
Use null to represent the bootstrap class loader.This method will 
return null in such implementations if this class was loaded by the 
bootstrap class loader. 

yh 

public ClassLoader getClassLoader()t{ 

ClassLoader cl=getClassLoader0(); 

if (cl==null) 

return null; 

SecurityManager sm=System.getSecurityManager():; 

if (sm!=null) { 

ClassLoader ccl=ClassLoader.getCallerClassLoader(); 

if (ccl!=nyull&&ccl!l=cl&&1cl.isAncestor (ccl) ) { 

sm.checkPermission 

(SecurityConstants.GET_ CLASSLOADER PERMISSION) ; 
} 
} 


return cl; 


} 


扩展 类 加 载 器 (Extension ClassLoader) : 这 个 加 载 器 由 
sun.misc.Launcher $ExtClassLoader 实 现 ， 它 负责 加 载 <JAVA_HOME > 
Miibvext 目 录 中 的 ， 或 者 被 java.ext.dirs 系 统 变量 所 指定 的 路 径 中 的 所 有 
类 库 ， 开 发 者 可 以 直接 使 用 扩展 类 加 载 器 。 


应 用 程序 类 加 载 器 (Application ClassLoader) : 这 个 类 加 载 器 由 
sun.misc.Launcher $App-ClassLoader 实 现 。 由 于 这 个 类 加 载 器 是 
ClassLoader 中 的 getSystemClassLoader() 方 法 的 返回 值 ， 所 以 一 般 也 称 
它 为 系统 类 加 载 器 。 它 负责 加 载 用 户 类 路 径 (ClassPath) 上 所 指定 的 
类 库 ， 开 发 者 可 以 直接 使 用 这 个 类 加 载 器 ， 如 果 应 用 程序 中 没有 自 定 
义 过 上 自己 的 类 加 载 器 ， 一 般 情 况 下 这 个 就 是 程序 中 默认 的 类 加 载 器 。 


我 们 的 应 用 程序 都 是 由 这 3 种 类 加 载 句 互相 配合 进行 加 载 的 ， 如 果 
有 必要 ， 还 可 以 加 入 自己 定义 的 类 加 载 咽 。 这 些 类 加 载 器 之 间 的 关系 
一 般 如 图 7-2 所 示 。 


7-2 ”类 加 载 器 双 杀 委派 模型 


图 7-2 中 展示 的 类 加 载 絮 之 则 的 这 种 层次 关系 ， 称 为 类 加 载 右 的 双 
亲 委 派 模 型 (Parents Delegation Model) 。 双 亲 委 派 模 型 要 求 除了 顶层 
的 局 动 类 加 载 右 外 ， 其 余 的 类 加 载 硕 都 应 当 有 目 己 的 父 类 加 载 右 。 这 
里 类 加 载 器 之 间 的 父子 关系 一 般 不 会 以 继承 (Inheritance) 的 关系 来 实 
现 ， 而 是 都 使 用 组 合 (Composition) 关系 来 复 用 父 加 载 器 的 代码 。 


类 加 载 器 的 双亲 委派 模型 在 JDK 1.2 期 间 被 引入 并 被 广泛 应 用 于 之 
后 几乎 所 有 的 Java 程 序 中 ， 但 它 并 不 是 一 个 强制 性 的 约束 模型 ， 而 是 
Java 设 计 者 推荐 给 开发 者 的 一 种 类 加 载 磊 实现 方式 。 


双亲 委派 模型 的 工作 过 程 是 ， 如 采 一 个 类 加 载 右 收 到 了 类 加 载 的 
请 求 ， 它 首先 不 会 目 己 去 壬 试 加 载 这 个 类 ， 而 是 把 这 个 请 求 委 派 给 父 
类 加 载 右 去 完成 ， 每 一 个 层次 的 类 加 载 右 都 是 如 此 ， 因 此 所 有 的 加 载 
请 求 最 终 都 应 该 传送 到 顶层 的 局 动 类 加 载 占 中 ， 只 有 当 父 加 载 右 反馈 
目 己 无 法 完成 这 个 加 载 请 求人 它 的 搜索 范围 中 没有 找到 所 需 的 类 ) 
时 ， 子 加 载 嚣 才 会 竹 试 目 己 去 加 载 。 


使 用 双亲 委派 模型 来 组 织 类 加 载 器 之 间 的 关系， 有 一 个 显而易见 
的 好 处 瓯 是 Java 类 随 着 它 的 类 加 载 右 一 起 具备 了 一 种 融 有 优先 级 的 层 
次 天 系 。 例 如 类 java.lang.Object， 它 存放 在 rtjar 之 中 ， 无 论 哪 一 个 类 加 
载 器 要 加 载 这 个 类 ， 最 终 都 是 委派 给 处 于 模型 最 顶端 的 启动 类 加 载 右 
进行 加 载 ， 因 此 Object 类 在 程序 的 各 种 类 加 载 磺 环境 中 都 是 同一 个 
类 。 相 反 ， 如 有 果 没 有 使 用 双亲 委派 模型 ， 由 各 个 类 加 载 器 目 行 去 加 载 
的 话 ， 如 果 用 户 目 己 编写 了 一 个 称 为 java.lang.Object 的 类 ， 并 放 在 程 
序 的 ClassPath 中 ， 那 系统 中 将 会 出 现 多 个 不 同 的 Object 类 ，Java 类 型 体 
系 中 最 基础 的 行为 也 瓯 无 法 保证 ， 应 用 程序 也 将 会 变 得 一 片 混乱 。 如 
果 读 者 有 兴趣 的 话 ， 可 以 尝试 去 编写 一 个 与 rt.jar 类 库 中 已 有 类 重 名 的 
Java 类 ， 将 会 发 现 可 以 正常 编译 ， 但 永远 无 法 被 加 载运 行 |]。 


双亲 委派 模型 对 于 保证 Java 程 序 的 稳定 运作 很 重要 ， 但 它 的 实现 
却 非 党 简单， 实现 双 邓 委派 的 代码 都 集中 在 java.lang.ClassLoader 的 
loadClass() 方 法 之 中 ， 如 代码 清单 7-10 所 示 ， 人 逻辑 清晰 易 仅 ， 先 检 查 是 
否 已 经 被 加 载 过 ， 若 没有 加 载 则 调用 父 加 载 器 的 loadClass() 方 法 ， 敬 
父 加 载 器 为 空 则 默认 使 用 启动 类 加 载 器 作为 父 加 载 器 。 如 果 父 类 加 载 
失败 ， 抛 出 ClassNotFoundException 有 异常 后 ， 再 调用 自己 的 findClass() 
方法 进行 加 载 。 


代码 清单 7-10 ”双亲 委派 模型 的 实现 


protected synchronized Class<?>1oadClass (String name,boolean 
resolve) throws ClassNotFoundException 


{ 

// 首 先 ， 检 查 请 求 的 类 是 否 已 经 被 加 载 过 了 
Class c=findLoadedClass (name) ; 
if (c==null) { 

try{ 
if (parent!=null) { 

c=parent .loadClass (name,false) ; 
}elsef{ 

c=findBootstrapClassOrNull (name) ; 


} 

}catch (ClassNotFoundException e) { 

// 如 果 父 类 加 载 器 抛 出 ClassNotFoundException 
// 说 明 父 类 加 载 器 无 法 完成 加 载 请 求 


} 

if (c==null) { 

// 在 父 类 加 载 器 无 法 加 载 的 时 候 
// 再 调用 本 身 的 findClass 方 法 来 进行 类 加 载 
c=findClass (name) ; 


} 


if (resolve) { 
resolveClass (c) ; 
} 

return c; 


} 


[1] 这 里 只 限于 HotSpot， 像 MRP、Maxine 等 虚拟 机 ， 整 个 虚拟 机 本 身 
都 是 由 Java 编 写 的 ， 自 然 Bootstrap ClassLoader 也 是 由 Java 语 言 而 不 是 
C++ 实 现 的 。 退 一 步 讲 ， 除 了 HotSpot 以 外 的 其 他 两 个 高 性 能 虚拟 机 
JRockit 和 J9 都 有 一 个 代表 Bootstrap ClassLoader 的 Java 类 存在 ， 但 是 关 
键 方法 的 实现 仍然 是 使 用 JNI 回 调 到 C (注意 不 是 Ct++) 的 实现 上 ， 这 
个 Bootstrap ClassLoader 的 实例 也 无 法 被 用 户 获取 到 。 

[2 即使 自 定 义 了 自己 的 类 加 载 器 ， 强 行 用 defineClass() 方 法 去 加 载 一 个 
以 "java.lang" 开 头 的 类 也 不 会 成 功 。 如 果 党 试 这样 做 的 话 ， 将 会 收 到 一 
个 由 虚拟 机 自己 抛 出 的 "java.lang.SecurityException:Prohibited package 


; ny 
name:java.lang" 异 第 。 


7.4.3 ”破坏 双亲 委派 模型 


上 文 提 到 过 双亲 委派 模型 并 不 是 一 个 强制 性 的 约束 模型 ， 而 是 
Java 设 计 者 推荐 给 开发 者 的 类 加 载 右 实现 方式 。 在 Java 的 世界 中 大 部 
分 的 类 加 载 器 都 遵循 这 个 模型 ， 但 也 有 例外 ， 到 目前 为 止 ， 双 末 委 派 
模型 主要 出 现 过 3 较 大 规模 的 “被 破坏 ”情况 。 


双亲 委派 模型 的 第 一 次 “被 破坏 ”其 实 发 生 在 双亲 委派 模型 出 现 之 
前 一 一 即 JDK 1.2 发 布 之 前 。 由 于 双亲 委派 模型 在 JDK 1.2 之 后 才 被 引 
入 ， 而 类 加 载 器 和 抽象 类 java.lang.ClassLoader 则 在 JDK 1.0 时 代 就 已 经 
存在 ， 面 对 已 经 存在 的 用 户 自 定义 类 加 载 器 的 实现 代码 ，Java 设 计 者 
引入 双亲 委派 模型 时 不 得 不 做 出 一 些 妥协 。 为 了 向 前 兼容 ，JDK 1.2 之 
后 的 java.lang.ClassLoader 添 加 了 一 个 新 的 protected 方 法 findClass0， 在 
此 之 前 ， 用 户 去 继承 java.lang.ClassLoader 的 唯一 目的 就 是 为 了 重 写 
loadClass() 方 法 ， 因 为 虚拟 机 在 进行 类 加 载 的 时 候 会 调用 加 载 器 的 私 
有 方法 loadClassInternal()， 而 这 个 方法 的 唯一 逻辑 就 是 去 调用 自己 的 
loadClass() ° 


上 一 市 我 们 已 经 看 过 loadClass0) 方 法 的 人 代码， 双亲 委 派 的 具体 逻 
辑 就 实现 在 这 个 方法 之 中 ，JDK 1.2 之 后 已 不 提倡 用 户 再 去 禾 盖 
loadClass() 方 法 ， 而 应 当 把 自己 的 类 加 载 逻 辑 写 到 findClass0) 方 法 中 ， 


在 loadClass() 方 法 的 逻辑 里 如 果 父 类 加 载 失 败 ， 则 会 调用 自己 的 
findClass() 方 法 来 完成 加 载 ， 这 样 就 可 以 保证 新 写 出 来 的 类 加 载 絮 是 和 从 
合 双亲 委派 规则 的 。 


双亲 委派 模 型 的 第 二 次 “被 破坏 是 由 这 个 模型 目 身 的 缺陷 所 导致 
的 ， 双 亲 委 派 很 好 地 解决 了 各 个 类 加 载 器 的 基础 类 的 统一 问题 ( 越 基 
础 的 类 由 越 上 层 的 加 载 器 进行 加 载 ，， 基 础 类 之 所 以 称 为 “基础 "， 是 
为 它们 总 是 作 为 被 用 户 代 码 调用 的 API， 但 世事 往往 没有 绝对 的 完 
美 ， 如 末 基 础 类 又 要 调用 回 用 户 的 代码 ， 那 该 怎么 办 ? 


这 并 非 是 不 可 能 的 事情 ， 一 个 典型 的 例子 便 是 JNDI 服 务 ，JNDI 现 
在 已 经 是 Java 的 标准 服务 ， 它 的 代码 由 启动 类 加 载 器 去 加 载 (在 JDK 
1.3 时 放 进 去 的 rtjar) ,但 JNDI 的 目的 就 是 对 资源 进行 集中 管理 和 查 
找 ， 它 需要 调用 由 独立 上 商 实现 并 部 署 在 应 用 程序 的 ClassPath 下 的 
JNDI 接 口 提供 者 〈SPLService Provider Interface) 的 代码 ， 但 启动 类 加 
载 器 不 可 能 “认识 ”这 些 代码 啊 ! 那 该 怎么 办 ? 


为 了 解决 这 个 问题 ，Java 设 计 团 队 只 好 引入 了 一 个 不 太 优 雅 的 设 
计 : 线程 上 下 文 类 加 载 器 (Thread Context ClassLoader) 。 这 个 类 加 载 
右 可 以 通过 java.lang.Thread 类 的 setContextClassLoaser0) 方 法 进行 设 
置 ， 如 果 创建 线程 时 还 未 设置 ， 它 将 会 从 父 线程 中 继承 一 个 ， 如 采 在 
应 用 程序 的 全 局 范围 内 都 没有 设置 过 的 话 ， 那 这 个 类 加 载 右 默认 残 是 
应 用 程序 类 加 载 癸 。 


有 了 线程 上 下 文 类 加 载 锋 ， 融 可 以 做 一 些 “ 和 舞弊 ”的 事情 了 ，JNDI 
服务 使 用 这 个 线程 上 下 文 类 加 载 器 去 加 载 所 需要 的 SPI 代 码 ， 也 就 是 父 
类 加 载 强 请 求 子 类 加 载 器 去 完成 类 加 载 的 动作 ， 这 种 行为 实际 上 就 是 
打通 了 双亲 委派 模型 的 层次 结构 来 逆 癌 使 用 类 加 载 器 ， 实 际 上 已 经 违 
背 了 双亲 委派 模型 的 一 般 性 原则 ， 但 这 也 是 无 可 奈何 的 事情 。Java 中 
所 有 涉及 SPI 的 加 载 动作 基本 上 都 采用 这 种 方式 ， 例 如 JNDI、JDBC、 
JCE、JAXB 和 JBI 等 。 


双亲 委派 模型 的 第 三 次 “被 破坏 ”是 由 于 用 户 对 程序 动态 性 的 追求 
而 导致 的 ， 这 里 所 说 的 “动态 性 ” 指 的 是 当前 一 些 非 第 “热门 ”的 名 词 : 
代码 热 苦 换 (HotSwap) 、 模 块 热 部 署 (Hot Deployment) 等 ， 说 日 了 
束 是 布 望 应 用 程序 能 像 我 们 的 计算 机 外 设 那 样 ， 接 上 鼠标 、U 表 ， 不 
用 重 局 机 右 束 能 立即 使 用 ， 鼠 标 有 问题 或 要 升级 束 换 个 鼠标 ， 不 用 停 
机 也 不 用 重启 。 对 于 个 人 计算 机 来 说 ， 重 启 一 次 其 实 没有 什么 大 不 了 
的 ， 但 对 于 一 些 生产 系统 来 说 ， 关 机 重 局 一 次 可 能 吏 要 被 列 为 生产 事 
故 ， 这 种 情况 下 热 部 署 束 对 软件 开发 者 ， 尤 其 是 企业 级 软件 开发 者 具 
有 很 大 的 吸引 力 。 


Sun 公 司 所 提出 的 JSR-294[11、JSR-27705 规 范 在 与 JCP 组 织 的 模块 
化 规范 之 争 中 落 败 给 JSR-291 ( 即 OSGi R4.2) ， 虽 然 Sun 不 甘 失 去 Java 
模块 化 的 主导 权 ， 独 立 在 发 展 Jigsaw 项 目 ， 但 目前 OSGi 已 经 成 为 了 业 
界 “ 事 实 上 ”的 Java 模 块 化 标准 站， 而 OSGi 实 现 模 块 化 热 部 署 的 关键 则 


是 它 自 定义 的 类 加 载 器 机 制 的 实现 。 每 一 个 程序 模块 (OSGi 中 称 为 
Bundle) 都 有 一 个 自己 的 类 加 载 器 ， 当 需要 更 换 一 个 Bundle 时 ， 就 把 
Bundle 连 同类 加 载 右 一 起 换 挥 以 实现 代码 的 热 蔡 换 。 


在 OSGi 环 境 下 ， 类 加 载 右 不 再 是 双亲 委派 模型 中 的 树 状 结构 ， 而 
是 进一步 发 展 为 更 加 复杂 的 网 状 结构 ， 当 收 到 类 加 载 请 求 时 ，OSGi 将 
按照 下 面 的 顺序 进行 类 搜索 : 


1) 将 以 java.* 开 头 的 类 委派 给 父 类 加 载 器 加 载 。 
2) 否则 ， 将 委派 列表 名 单 内 的 类 委派 给 父 类 加 载 器 加 载 。 


3) 否则 ， 将 Import 列 表 中 的 类 委派 给 Export 这 个 类 的 Bundle 的 类 
加 载 器 加 载 。 


4) 否则 ， 查 找 当 前 Bundle 的 ClassPath， 使 用 自己 的 类 加 载 器 加 
载 o 


5) 和 否则， 查找 类 是 否 在 自己 的 Fragment Bundle 中 ， 如 果 在 ， 则 委 
派 给 Fragment Bundle 的 类 加 载 嚣 加载。 


6) 否则 ， 查 找 Dynamic Import 列 表 的 Bundle， 委 派 给 对 应 Bundle 
的 类 加 载 器 加 载 。 


7) 否则 ， 类 查找 失败 。 


上 面 的 查找 顺序 中 只 有 开头 两 点 仍然 符合 双亲 委派 规则 ， 其 余 的 
类 查找 都 古 在 平 级 的 类 加 载 右 中 进行 的 。 


笔者 虽然 使 用 了 “被 破坏 ”这 个 词 来 形容 上 述 不 符合 双亲 委派 模型 
原则 的 行为 ， 但 这 里 “被 破坏 ”并 不 帝 有 贬义 的 感情 色彩 。 只 要 有 足够 
意义 和 理由 ， 突 破 已 有 的 原则 就 可 认为 是 一 种 创新 。 正 如 OSGi 中 的 类 
加 载 妖 并 不 符合 传统 的 双亲 委派 的 类 加 载 器 ， 并 且 业 界 对 其 为 了 实现 
热 部 署 而 融 来 的 额外 的 高 复杂 度 还 存在 不 少 和 争议 ， 但 在 Java 程 序 员 中 
基本 有 一 个 共识 : 0OSGi 中 对 类 加 载 器 的 使 用 是 很 值得 学 习 的 ， 弄 介 了 
OSGi 的 实现 ， 束 可 以 算是 掌握 了 类 加 载 右 的 精髓 。 


[1|JSR-294 : Improved Modularity Support in the Java Programming 
Language (Java 编 程 语言 中 的 改进 模块 性 支持 ) 

[2]JSR-277: Java Module System (Java 模 块 系统 ) 

[3] 如 果 读 者 对 Java 模 块 化 之 争 或 者 OSGi 本 号 感 兴趣 ， 可 以 阅读 笔者 的 
男 一 本 书 《 深 入 理解 OSGi:Equinox 原 理 、 应 用 与 最 佳 实践 》。 


7.5 本章 小 结 


本 章 介绍 了 类 加 载 过 程 的 “加 载 "、“ 验 证 *"、“ 准 备 ”、“ 解 析 ” 和 “ 初 
化 ”5 个 阶段 中 虚拟 机 进行 了 哪些 动作 ， 还 介绍 了 类 加 载 器 的 工作 原 
理 及 其 对 虚拟 机 的 意义 。 


经 过 第 6 和 第 7 两 章 的 讲解 ， 相 信 读 者 已 经 对 如 何在 Class 文 件 中 定 
义 类 ， 如 何 将 类 加 载 到 虚拟 机 中 这 两 个 问题 有 了 比较 系统 的 了 解 ， 第 8 
章 我 们 将 一 起 来 看 看 虚拟 机 如 何 执 行 定义 在 Class 文 件 里 的 字 市 码 。 


第 8 章 ” 虚 拟 机 字 节 人 码 执行 引擎 


代码 编译 的 结果 从 本 地 机 需 码 转变 为 字 世 码 ， 是 存储 格式 发 展 的 
一 小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


8.1 概述 


执行 引擎 是 Java 虚 拟 机 最 核心 的 组 成 部 分 之 一 。“ 虚 拟 机 ”是 一 个 
相对 于 “物理 机 ”的 概念 ， 这 两 种 机 需 都 有 代码 执行 能 力 ， 其 区 别 是 物 
理 机 的 执行 引擎 是 直接 建立 在 处 理 器 、 硬 件 、 指 令 集 和 操作 系统 层面 
上 的 ， 而 虚拟 机 的 执行 引擎 则 是 由 目 己 实现 的 ， 因 此 可 以 目 行 制定 指 
令 集 与 执行 引擎 的 结构 体系 ， 并 且 能 够 执行 那些 不 被 便 件 直接 文 持 的 


日 令 集 格 式 。 


在 Java 虚 拟 机 规范 中 制定 了 虚拟 机 子 市 码 执行 引擎 的 概念 模型 ， 
这 个 概念 模型 成 为 各 种 虚拟 机 执行 引擎 的 统一 外 观 (Facade) 。 在 不 
同 的 虚拟 机 实现 里 面 ， 执 行 引 擎 在 执行 Java 代 码 的 时 候 可 能 会 有 解释 
执行 (通过 解释 器 执行 ) 和 编译 执行 〈 通 过 即时 编译 器 产生 本 地 代码 
执行 ) 两 种 选择 趾 ， 也 可 能 两 者 兼备 ， 甚 至 还 可 能 会 包含 儿 个 不 同 级 
别 的 编译 器 执行 引 苟 。 但 从 外 观 上 看 起 来 ， 所 有 的 Java 虚 拟 机 的 执行 
引擎 都 是 一 怪 的 ， 输 入 的 是 子 节 码 文件 ， 处 理 过 程 是 子 市 码 解 术 的 等 


效 过 程 ， 输 出 的 是 执行 结果 ， 本 章 将 主要 从 概念 模型 的 角度 来 讲解 虚 
拟 机 的 方法 调用 和 字 节 码 执行 。 


[1] 有 一 些 虚 拟 机 (如 Sun Classic VM) 的 内 部 只 存在 解释 器 ， 只 能 解 
释 执 行 ， 而 另外 一 些 虚拟 机 (如 BEA JRockit) 的 内 部 只 存在 即时 编译 


顷 ， 只 能 编译 执行 。 


8.2 ”运行 时 栈 帧 结构 


栈 帧 (Stack Frame) 是 用 于 文 持 虚 拟 机 进行 方法 调用 和 方法 执行 
的 数据 结构 ， 它 是 虚拟 机 运行 时 数据 区 中 的 虚拟 机 栈 (Virtual Machine 
Stack) 中 的 栈 元 素 。 栈 帧 存储 了 方法 的 局 部 变量 表 、 操 作 数 栈 、 动 态 
连接 和 方法 返回 地 址 等 信息 。 每 一 个 方法 从 调用 开始 至 执行 完成 的 过 
程 ， 都 对 应 着 一 个 栈 帧 在 虚拟 机 栈 里 面 从 入 栈 到 出 栈 的 过 程 。 


每 一 个 栈 帧 都 包括 了 局 部 变量 表 、 操 作 数 栈 、 动 态 连接 、 方 法 返 
回 地 址 和 一 些 人 额外 的 附加 信息 。 在 编译 程序 代码 的 时 候 ， 栈 帧 中 需要 
多 大 的 局 部 变量 表 ， 多 深 的 操作 数 栈 痢 已 经 完全 确定 了 ， 并 且 写 入 到 
方法 表 的 Code 属 性 之 中 由， 因此 一 个 栈 帧 需要 分 配 多 少 内 存 ， 不 会 受 
到 程序 运行 期 变量 数据 的 影响 ， 而 仅仅 取决 于 具体 的 虚拟 机 实现 。 


一 个 线程 中 的 方法 调用 链 可 能 会 很 长 ， 很 多 方法 都 同时 处 于 执行 
状态 。 对 于 执行 引擎 来 说 ， 在 活动 线程 中 ， 只 有 位 于 栈 顶 的 栈 帧 才 是 
有 效 的 ， 称 为 当前 栈 帧 (Current Stack Frame) ， 与 这 个 栈 帧 相关 联 的 
方法 称 为 当前 方法 (Current Method) 。 执 行 引 警 运 行 的 所 有 字 节 码 指 
令 都 只 针对 当前 栈 帧 进行 操作 ， 在 概念 模型 上 ， 典 型 的 栈 帧 结构 如 图 
8-1 所 示 。 


当前 线程 线程 2 线程 n 
当前 栈 帧 


Current Stack Frame 


局 部 变量 表 
Local Variable Table 


操作 栈 
Operand Stack 


Dynamic Linking | 1 | | 


返回 地 址 
Return Address 


栈 帧 n 
Stack Frame n 
栈 帧 2 
Stack Frame 2 
栈 帧 1 
Stack Frame 1 


8-1 栈 帧 的 概念 结构 


接 下 来 详细 讲解 一 下 栈 帆 中 的 局 部 变量 表 、 操 作 数 栈 、 动 态 连 
接 、 方 法 返回 地 址 等 各 个 部 分 的 作用 和 数据 结构 。 


8.2.1 局 部 变量 表 


局 部 变量 表 (Local Variable Table) 是 一 组 变量 值 存储 空间 ， 用 于 
存放 方法 参数 和 方法 内 部 定义 的 局 部 变量 。 在 Java 程 序 编译 为 Class 文 
件 时 ， 就 在 方法 的 Code 属 性 的 max_locals 数 据 项 中 确定 了 该 方法 所 需 
要 分 配 的 局 部 变量 表 的 最 大 容量 。 


局 部 变量 表 的 容量 以 变量 槽 《Variable Slot， 下 称 Slot) 为 最 小 单 
位 ， 虚 拟 机 规范 中 并 没有 明确 指明 一 个 Slot 应 占用 的 内 存 空间 大 小 ， 
只 是 很 有 导向 性 地 说 到 每 个 Slot 都 应 该 能 存放 一 个 boolean、byte、 
char、short、int、float、reference 或 returnAddress 类 型 的 数据 ， 这 8 种 数 
据 类 型 ， 都 可 以 使 用 32 位 或 更 小 的 物理 内 存 来 存放 ， 但 这 种 描述 与 明 
确 指出 “每 个 Slot 占用 32 位 长 度 的 内 存 空间 ”是 有 一 些 差别 的 ， 它 允许 
Slot 的 长 度 可 以 随 着 处 理 器 、 操 作 系 统 或 虚拟 机 的 不 同 而 发 生变 化 。 
只 要 保证 即使 在 64 位 虚拟 机 中 使 用 了 64 位 的 物理 内 存 空间 去 实现 一 个 
Slot， 虚 拟 机 仍 要 使 用 对 齐 和 补 白 的 手段 让 Slot 在 外 观 上 看 起 来 与 32 位 
虚拟 机 中 的 一 致 。 


既然 前 面 提 到 了 Java 虚 拟 机 的 数据 类 型 ， 在 此 再 简单 介绍 一 下 它 
们 。 一 个 Slot 可 以 存放 一 个 32 位 以 内 的 数据 类 型 ，Java 中 占用 32 位 以 内 
的 数据 类 型 有 boolean、byte、char、short、int、float、referencel31 和 
returnAddress 8 种 类 型 。 前 面 6 种 不 需要 多 加 解释 ， 读 者 可 以 按照 Java 
语言 中 对 应 数据 类 型 的 概念 去 理解 它们 〈 仅 是 这 样 理解 而 已 ，Java 语 
言 与 Java 虚 拟 机 中 的 基本 数据 类 型 是 存在 本 质 差别 的 ) ， 而 第 7 种 


reference 类 型 表示 对 一 个 对 象 实例 的 引用 ， 虚 拟 机 规范 既 没 有 说 明 它 
的 长 度 ， 也 没有 明确 指出 这 种 引用 应 有 怎样 的 结构 。 但 一 般 来 说 ， 虚 
拟 机 实现 至 少 都 应 当 能 通过 这 个 引用 做 到 两 点 ， 一 征 从 此 引用 中 直接 
或 间接 地 查找 到 对 象 在 Java 堆 中 的 数据 存放 的 起 始 地 址 索引 ， 二 是 此 
引用 中 直接 或 间接 地 碍 找到 对 象 所 属 数据 类 型 在 方法 区 中 的 存储 的 类 
型 信息 ， 否 则 无 法 实现 Java 语 言 规范 中 定义 的 语法 约束 4 。 第 8 种 即 
returnAddress 类 型 目前 已 经 很 少见 了 ， 它 是 为 字 市 码 指 令 jsr、jsr_w 和 
ret 服 务 的 ， 指 癌 了 一 条 字 节 码 指 令 的 地 址 ， 很 古老 的 Java 虚 拟 机 曾经 
使 用 这 几 条 指令 来 实现 异常 处 理 ， 现 在 已 经 由 异常 表 代 替 。 


对 于 64 位 的 数据 类 型 ， 虚 拟 机 会 以 高 位 对 齐 的 方式 为 其 分 配 两 个 
连续 的 Slot 空 间 。Java 语 言 中 明确 的 (reference 类 型 则 可 能 是 32 位 也 可 
能 是 64 位 ) 64 位 的 数据 类 型 只 有 long 和 double 两 种 。 值 得 一 提 的 是 ， 这 
里 把 long 和 double 数 据 类 型 分 割 存 储 的 做 法 与 4ong 和 double 的 非 原子 性 
协定 ”中 把 一 次 long 和 double 数 据 类 型 读 写 分 割 为 两 次 32 位 读 写 的 做 法 
有 些 类 似 ， 读 者 阅读 到 Java 内 存 模型 时 可 以 互相 对 比 一 下 。 不 过 ,由 
于 局 部 变量 表 建 立 在 线程 的 堆栈 上 ， 是 线程 私有 的 数据 ， 无 论 读 写 两 
个 连续 的 Slot 是 否 为 原子 操作 ， 都 不 会 引起 数据 安全 问题 5 。 


虚拟 机 通过 索引 定位 的 方式 使 用 局 部 变量 表 ， 有 索引 值 的 范围 是 从 0 
开始 至 局 部 变量 表 最 大 的 Slot 数量 。 如 果 访 问 的 是 32 位 数据 类 型 的 变 
量 ， 索 引 n 就 代表 了 使 用 第 n 个 Slot， 如 果 是 64 位 数据 类 型 的 变量 ， 则 


说 明 会 同时 使 用 n 和 n+1 两 个 Slot。 对 于 两 个 相 邻 的 共同 存放 一 个 64 位 
数据 的 两 个 Slot， 不 允许 采用 任何 方式 单独 访问 其 中 的 某 一 个 ，Java 虚 
拟 机 规范 中 明确 要 求 了 如 有 果 过 到 进行 这 种 操作 的 字 节 码 序列 ， 虚 拟 机 
应 该 在 类 加 载 的 校 验 阶段 抛 出 异常 。 


在 方法 执行 时 ， 虚 拟 机 是 使 用 局 部 变量 表 完 成 参数 值 到 参数 变量 
列表 的 传递 过 程 的 ， 如 果 执 行 的 是 实例 方法 〈 非 static 的 方法 ) ， 那 局 
部 变量 表 中 第 0 位 索引 的 Slot 默 认 是 用 于 传递 方法 所 属 对 和 象 实例 的 引 
用 ， 在 方法 中 可 以 通过 关键 字 "this" 来 访问 到 这 个 隐 含 的 参数 。 其 余 参 
数 则 按照 参数 表 顺 序 排 列 ， 占 用 从 1 开始 的 局 部 变量 Slot， 参 数 表 分 配 
完毕 后 ， 再 根据 方法 体内 部 定义 的 变量 顺序 和 作用 域 分 配 其 余 的 
9lot 。 


为 了 尽 可 能 节省 栈 帧 空间 ， 局 部 变量 表 中 的 Slot 是 可 以 重用 的 ， 
方法 体 中 定义 的 变量 ， 其 作用 域 并 不 一 定 会 履 瘟 整个 方法 体 ， 如 采 当 
前 学 市 码 PC 计 数 右 的 值 已 经 超出 了 某 个 变量 的 作用 域 ， 那 这 个 变量 对 
应 的 Slot 就 可 以 交 给 其 他 变量 使 用 。 不 过 ， 这 样 的 设计 除了 市 省 栈 帧 
空间 以 外 ， 还 会 伴随 一 些 额 外 的 副作用 ， 例如， 在 某 些 情况 下 ，Slot 
的 复 用 会 直接 影响 到 系统 的 垃圾 收集 行为 ， 请 看 代码 清单 8-1~ 代 码 清 
单 8-3 的 3 个 演示 。 


代码 清单 8-1 局 部 变量 表 Slot 复 用 对 垃圾 收集 的 影响 之 一 


public static void main (String[]jargs) ()({ 
byte[]placeholder=new byte[64*1024*1024]; 
System.gcl( ); 


代码 清单 8-1 中 的 代码 很 简单 ， 即 癌 内 存 填 充 了 64MB 的 数据 ， 然 
后 通知 虚拟 机 进行 垃圾 收集 。 我 们 在 虚拟 机 运行 参数 中 加 上 "- 
Verbose:gc" 来 看 看 垃圾 收集 的 过 程 ， 发 现在 System.gcO 运 行 后 并 没有 
回收 这 64MB 的 内 存 ， 下 面 古 运行 的 结 


[GC 66846K- >65824K (125632K) ，0.0032678 secs] 
[Full GC 65824K- >65746K (125632K) ,0.0064131 secs] 


没有 回收 placeholder 所 占 的 内 存 能 说 得 过 去 ， 因 为 在 执行 
System.gc0O 时 ， 变 量 placeholder 还 处 于 作用 域 之 内 ， 虚 拟 机 上 自然 不 敢 回 
收 placeholder 的 内 存 。 那 我 们 把 代码 修改 一 下 ， 变 成 代码 清单 8-2 中 的 
样子 。 


代码 清单 8-2 局 部 变量 表 Slot 复 用 对 垃圾 收集 的 影响 之 二 


public static void main (String[]args) (){ 
{ 
byte[]placeholder=new byte[64*1024*1024]; 


System.gcl( ); 
} 


加 入 了 花 括 号 之 后 ，placeholder 的 作用 域 被 限制 在 花 括号 之 内 ， 
从 代码 逻辑 上 讲 ， 在 执行 System.gcO 的 时 候 ，placeholder 已 经 不 可 能 


被 访问 了 ， 但 执行 一 下 这 段 程序 ， 会 发 现 运行 结 采 如 下 ， 还 是 有 
64MB 的 内 存 没 有 被 回收 ， 这 又 是 为 什么 呢 ? 


[GC 66846K- >65888K (125632K) ，0.0009397 secs] 
[Full GC 65888K- >65746K (125632K) ，0.0051574 secs] 


在 解释 为 什么 之 前 ， 我 们 先 对 这 上 段 代 码 进 行 第 二 次 修改 ， 在 调用 
System.gc() 之 前 加 入 一 行 "int a=0;"， 变 成 代码 清单 8-3 的 样子 。 


代码 清单 8-3 ”局 部 变量 表 Slot 复 用 对 垃圾 收集 的 影响 之 三 


public static void main (String[]args) (){ 
{ 
byte[]placeholder=new byte[64*1024*1024]; 


int a=0; 
System.gc(); 
} 


这 个 修改 看 起 来 很 莫名 其 妙 ， 但 运行 一 下 程序 ， 却 发 现 这 次 内 存 
真 的 被 正确 回收 了 。 


[GC 66401K->65778K (125632K) ,0.0035471 secs] 
[Full GC 65778K- >218K (125632K) ，0.0140596 secs] 


在 代码 清单 8-1~ 代 码 清单 8-3 中 ，placeholder 能 否 被 回收 的 根本 原 
是 : 局 部 变量 表 中 的 Slot 是 否 还 存 有 关于 placeholder 数 组 对 象 的 引 


用 。 第 一 次 修改 中 ， 代 码 虽 然 已 经 离开 了 placeholder 的 作用 域 ， 但 在 
此 之 后 ， 没 有 任何 对 局 部 变量 表 的 读 写 操作 ，placeholder 原 本 所 占用 


的 Slot 还 没有 被 其 他 变量 所 复 用 ， 所 以 作为 GC Roots 一 部 分 的 局 部 变 
量 才 仍然 保持 着 对 它 的 关联 。 这 种 关联 没有 被 及 时 打 断 ， 在 绝 大 部 分 
情况 下 影响 都 很 轻微 。 但 如 采 遇 到 一 个 方法 ， 其 后 面 的 代码 有 一 些 耗 
时 很 长 的 操作 ， 而 前 面 又 定义 了 占用 了 大 量 内 存 、 实 际 上 已 经 不 会 再 
使 用 的 变量 ， 手 动 将 其 设置 为 null 值 〈 用 来 代替 那 名 int a=0， 把 变量 对 
应 的 局 部 变量 表 Slot 清 空 ) 便 不 见得 是 一 个 绝对 无 意义 的 操作 ， 这 种 
操作 可 以 作为 一 种 在 极 特殊 情形 (对 象 占用 内 存 大 、 此 方法 的 栈 帧 长 
时 间 不 能 被 回收 、 方 法 调用 次 数 达 不 到 JIT 的 编译 条 件 ) 下 的 “ 奇 技 ” 来 
使 用 。Java 语 言 的 一 本 非常 著名 的 书籍 《Practical Java》 中 把 “不 使 用 
的 对 象 应 手动 赋值 为 null”* 作 为 一 条 推荐 的 编码 规则 ， 但 是 并 没有 解释 
具体 的 原因 ， 很 长 时 间 之 内 都 有 读者 对 这 条 规则 感到 疑惑 。 


虽然 代码 清单 8-1~ 代 码 请 单 8-3 的 代码 示例 说 明了 赋 null 值 的 操作 
在 某 些 情况 下 确实 是 有 用 的 ， 但 笔者 的 观点 是 不 应 当 对 赋 null 值 的 操 
作 有 过 多 的 依赖 ， 更 没有 必要 把 它 当 做 一 个 普遍 的 编码 规则 来 推广 。 
原因 有 两 点 ， 从 编码 角度 讲 ， 以 恰当 的 变量 作用 域 来 控制 变量 回收 时 
间 才 是 最 优雅 的 解决 方法 ， 如 代码 清单 8-3 那 样 的 场景 并 不 多 见 。 更 天 
键 的 是 ， 从 执行 角度 讲 ， 使 用 赋 null 值 的 操作 来 优化 内 存 回 收 是 建立 
在 对 字 节 码 执 行 引 擎 概念 模型 的 理解 之 上 的 ， 在 第 6 章 介绍 完 字 市 码 
后 ， 笔 者 专门 增加 了 一 个 6.5 闻 “公有 设计 、 私 有 实现 "来 强调 概念 模型 
与 实际 执行 过 程 是 外 部 看 起 来 等 效 ， 内 部 看 上 去 则 可 以 完全 不 同 。 在 
虚拟 机 使 用 解释 器 执行 时 ， 通 常 与 概念 模型 还 比较 接近 ， 但 经 过 JIT 编 


译 器 后 ， 才 是 虚拟 机 执行 代码 的 主要 方式 ， 赋 null 值 的 操作 在 经 过 JIT 
编译 优化 后 加 会 被 消除 掉 ， 这 时 候 将 变量 设置 为 nul] 惑 是 没有 意义 

的 。 字 节 码 被 编译 为 本 地 代码 后 ， 对 GC Roots 的 枚 举 也 与 解释 执行 时 
期 有 巨大 差别 ， 以 前 面 例子 来 看 ， 代 码 清单 8-2 在 经 过 JIT 编 译 后 ， 
System.gc() 执 行 时 束 可 以 正确 地 回收 挥 内 存 ， 无 须 写成 代码 清单 8-3 的 
样子 。 


天 于 局 部 变量 表 ， 还 有 一 点 可 能 会 对 实际 开发 产生 影响 ， 就 是 局 
部 变量 不 像 前 面 介绍 的 类 变量 那样 存在 “准备 阶段 "。 通 过 第 7 章 的 讲 
解 ， 我 们 已 经 知道 类 变量 有 两 次 巍 初 始 值 的 过 程 ， 一 次 在 准备 阶段 ， 
赋予 系统 初始 值 ， 另 外 一 次 在 初始 化 阶段 ， 赋 予 程 序 员 定义 的 初始 
值 。 因 此 ， 即 使 在 初始 化 阶段 程序 员 没 有 为 类 变量 赋值 也 没有 关系 ， 
类 变量 仍然 具有 一 个 确定 的 初始 值 。 但 局 部 变量 就 不 一 样 ， 如 果 一 个 
局 部 变量 定义 了 但 没有 赋 初 始 值 是 不 能 使 用 的 ， 不 要 认为 Java 中 任何 
情况 下 都 存在 诸如 整 型 变量 默认 为 0， 布 尔 型 变量 默认 为 false 等 这 样 的 
上 默认 值 。 如 代码 清单 8-4 所 示 ， 这 段 代码 其 实 并 不 能 运行 ， 还 好 编译 右 
能 在 编译 期 间 束 检查 到 并 提示 这 一 点 ， 即 便 编 译 能 通过 或 者 手动 生成 
字 市 码 的 方式 制造 出 下 面 代 码 的 效果 ， 字 市 码 校 验 的 时 候 也 会 被 虚拟 
机 发 现 而 导致 类 加 载 失 败 。 


代码 清单 8-4 未 赋值 的 局 部 变量 


public static void main (String[]args) { 


Int ai 
System.out.println (a) ; 


[1] 详 细 内 容 请 参见 2.2 节 的 相关 内 容 。 

[2] 详 细 内 容 请 参见 6.3.7 节 的 相关 内 容 。 

[3]Java 虚 拟 机 规范 中 没有 明确 规定 reference 类 型 的 长 度 ， 它 的 长 度 与 
实际 使 用 32 还 是 64 位 虚拟 机 有 关 ， 如 果 是 64 位 虚拟 机 ， 还 与 是 否 开启 
某 些 对 象 指针 压缩 的 优化 有 关 ， 这 里 暂且 只 取 32 位 虚拟 机 的 reference 
长 度 。 

[4 并 不 是 所 有 语言 的 对 象 引 用 都 能 满足 这 两 点 ， 例 如 C++ 语言 ， 默 认 
情况 下 (不 开启 RTTI 支 持 的 情况 ) ， 就 只 能 满足 第 一 点 ， 而 不 满足 第 
二 点 。 这 也 是 为 何 C++ 中 提供 Java 语 言 里 很 常见 的 反射 的 根本 原因 。 
[5] 这 是 Java 内 存 模型 中 定义 的 内 容 ， 关 于 原子 操作 与 ong 和 double 的 
非 原子 性 协定 ”等 问题 ， 将 在 本 书 第 12 章 中 详细 讲解 。 


8.2.2 ”操作 数 栈 


操作 数 栈 (Operand Stack) 也 常 称 为 操作 栈 ， 它 是 一 个 后 入 移出 
(Last In First Out,LIFO) 栈 。 同 局 部 变量 表 一 样 ， 操 作 数 栈 的 最 大 深 
度 也 在 编译 的 时 候 写 入 到 Code 属 性 的 max_stacks 数 据 项 中 。 操 作 数 栈 
的 每 一 个 元 素 可 以 是 任意 的 Java 数 据 类 型 ， 包 括 long 和 double。32 位 数 
据 类 型 所 占 的 栈 容量 为 1，64 位 数据 类 型 所 占 的 栈 容量 为 2。 在 方法 执 
行 的 任何 时 候 ， 操 作 数 栈 的 深度 都 不 会 超过 在 max_stacks 数 据 项 中 设 
定 的 最 大 值 。 


当 一 个 方法 刚刚 开始 执行 的 时 候 ， 这 个 方法 的 操作 数 栈 是 空 的 ， 
在 方法 的 执行 过 程 中 ， 会 有 各 种 字 亨 码 指 令 往 操 作 数 栈 中 写 入 和 提取 
内 容 ， 也 就 古 出 栈 /入 栈 操作 。 例 如 ， 在 做 算术 运算 的 时 候 是 通过 操作 
数 栈 来 进行 的 ， 又 或 者 在 调用 其 他 方法 的 时 候 是 通过 操作 数 栈 来 进行 
参数 传递 的 。 


举 个 例子 ， 整 数 加 法 的 字 市 码 指 令 iadd 在 运行 的 时 候 操作 数 栈 中 
最 接近 栈 顶 的 两 个 元 素 已 经 存 入 了 两 个 int 型 的 数值 ， 当 执行 这 个 指令 
时 ， 会 将 这 两 个 int 值 出 栈 并 相 加 ， 然 后 将 相 加 的 结 采 入 栈 。 


操作 数 栈 中 元 素 的 数据 类 型 必须 与 字 市 码 指 令 的 序列 严格 匹配 ， 
在 编译 程序 代码 的 时 候 ， 编 译 嫩 要 严格 休 证 这 一 点 ， 在 类 校 验 阶段 的 


数据 流 分 析 中 还 要 再 次 验证 这 一 点 。 再 以 上 面 的 iadd 指 令 为 例 ， 这 个 
指令 用 于 整 型 数 加 法 ， 它 在 执行 时 ， 最 接近 栈 顶 的 两 个 元 素 的 数据 类 
型 必须 为 int 型 ， 不 能 出 现 一 个 long 和 一 个 float 使 用 iadd 命 令 相 加 的 情 
部 o 


男 外 ， 在 概念 模型 中 ， 两 个 栈 帧 作为 虚拟 机 栈 的 元 素 ， 是 完全 相 
互 独立 的 。 但 在 大 多 虚拟 机 的 实现 里 都 会 做 一 些 优化 处 理 ， 令 两 个 栈 
帧 出 现 一 部 分 重要 。 让 下 面 栈 帧 的 部 分 操作 数 栈 与 上 面 栈 帧 的 部 分 局 
部 变量 表 重 受 在 一 起 ， 这 样 在 进行 方法 调用 时 殉 可 以 共用 一 部 分 数 
据 ， 无 须 进行 额外 的 参数 复制 传递 ， 重 县 的 过 程 如 多 8-2 所 示 。 


操作 数 栈 


其 他 栈 帧 信息 


局 部 变量 表 


操作 数 栈 共享 区 域 | 重 又 区 域 “| 局 部 变量 表 共享 区 域 


操作 数 栈 


其 他 栈 帧 信息 


局 部 变量 表 


8-2 ”两 个 栈 帧 之 则 的 数据 共 至 


Java 虚 拟 机 的 解释 执行 引擎 称 为 “基于 栈 的 执行 引擎 ”>， 其 中 所 指 
的 “ 栈 ” 束 是 操作 数 栈 。 本 章 稍 后 会 对 基于 栈 的 代码 过 程 进行 更 详细 的 
讲解 。 


8.2.3 ”动态 连接 


每 个 栈 帧 都 包含 一 个 指向 运行 时 常量 池 呈 中 该 栈 帧 所 属 方法 的 引 
用 ， 持 有 这 个 引用 是 为 了 文 持 方法 调用 过 程 中 的 动态 连接 (Dynamic 
Linking) 。 通 过 第 6 章 的 讲解 ， 我 们 知道 Class 文 件 的 前 量 池 中 存 有 大 
量 的 符号 引用 ， 了 字 节 码 中 的 方法 调用 指令 整 以 常量 池 中 指 疝 方法 的 符 
号 引用 作为 参数 。 这 些 符号 引用 一 部 分 会 在 类 加 载 阶段 或 者 第 一 次 使 
用 的 时 候 束 转化 为 直接 引用 ， 这 种 转化 称 为 静态 解析 。 男 外 一 部 分 将 
在 每 一 次 运行 期 间 转 化 为 直接 引用 ， 这 部 分 称 为 动态 连接 。 关 于 这 两 
个 转化 过 程 的 详细 信息 ， 将 在 8.3 节 中 详细 讲解 。 


[1] 运 行 时 常量 池 可 参考 第 2 章 。 


8.2.4 方法 返回 地 址 


当 一 个 方法 开始 执行 后 ， 只 有 两 种 方式 可 以 退出 这 个 方法 。 第 一 
种 方式 是 执行 引擎 遇 到 任意 一 个 方法 返回 的 字 节 码 指令 ， 这 时 候 可 能 
会 有 返回 值 传递 给 上 层 的 方法 调用 者 〈 调 用 当前 方法 的 方法 称 为 调用 
者 ) ， 是 否 有 返回 值 和 返回 值 的 类 型 将 根据 遇 到 何 种 方法 返回 指令 来 
决定 ， 这 种 退出 方法 的 方式 称 为 正常 完成 出 口 (Normal Method 


Invocation Completion) 。 


另外 一 种 退出 方式 是 ， 在 方法 执行 过 程 中 遇 到 了 腊 常 ， 并 且 这 个 
异常 没有 在 方法 体内 得 到 处 理 ， 无 论 是 Java 虚 拟 机 内 部 产生 的 异常 ， 
还 是 代码 中 使 用 athrow 字 节 码 指令 产生 的 异常 ， 只 要 在 本 方法 的 异常 
表 中 没有 搜索 到 匹配 的 异常 处 理 器 ， 就 会 导致 方法 退出 ， 这 种 退出 方 
法 的 方式 称 为 异常 完成 出 口 (Abrupt Method Invocation 
Completion) 。 一 个 方法 使 用 异常 完成 出 口 的 方式 退出 ， 是 不 会 给 它 
的 上 层 调用 者 产生 任何 返回 值 的 。 


无 论 采用 何 种 退出 方式 ， 在 方法 退出 之 后 ， 都 需要 返回 到 方法 被 
调用 的 位 置 ， 程 序 才 能 继续 执行 ， 方 法 返回 时 可 能 需要 在 栈 帧 中 保存 
一 些 信 息 ， 用 来 帮助 恢复 它 的 上 层 方法 的 执行 状态 。 一 般 来 说 ， 方 法 
正常 退出 时 ， 调 用 者 的 PC 计数 紫 的 值 可 以 作为 返回 地 址 ， 栈 帧 中 很 可 


能 会 保存 这 个 计数 器 值 。 而 方法 异常 退出 时 ， 返 回 地 址 是 要 通过 异 
处 理 占 表 来 确定 的 ， 栈 帧 中 一 般 不 会 保存 这 部 分 信息 。 


方法 退出 的 过 程 实际 上 融 等 同 于 把 当前 栈 帧 出 栈 ， 因 此 退出 时 可 
能 执行 的 操作 有 : 恢复 上 层 方 法 的 局 部 变量 表 和 操作 数 栈 ， 把 返回 值 
(如 果 有 的 话 ) 压 入 调用 者 栈 帧 的 操作 数 栈 中， 调整 PC 计 数 器 的 值 以 
指 加 方法 调用 指令 后 面 的 一 条 指令 等 。 


8.2.5 ”附加 信息 


虚拟 机 规范 允许 具体 的 虚拟 机 实现 增加 一 些 规 范 里 没有 描述 的 信 
恩 到 栈 蚌 之 中 ， 例 如 与 调试 相关 的 信息 ， 这 部 分 信息 完全 取决 于 具体 
的 虚拟 机 实现 ， 这 里 不 再 详 述 。 在 实际 开发 中 ， 一 般 会 把 动态 连接 、 
方法 返回 地 址 与 其 他 附加 信息 全 部 归 为 一 类 ， 称 为 栈 帧 信息 。 


8.3 ”方法 调用 


方法 调用 并 不 等 同 于 方法 执行 ， 方 法 调用 阶段 唯一 的 任务 号 是 确 
定 补 调用 方法 的 版 本 〈 即 调用 哪 一 个 方法 ) ， 和 暂时 还 不 涉及 方法 内 部 
的 具体 运行 过 程 。 在 程序 运行 时 ， 进 行 方法 调用 十 最 普 遇 、 最 频繁 的 
操作 ， 但 前 面 已 经 讲 过 ，Class 文 件 的 编译 过 程 中 不 包含 传统 编译 中 的 
连接 步 桑 ， 一 切 方法 调用 在 Class 文 件 里 面 存 储 的 都 只 是 符号 引用 ， 而 
不 是 方法 在 实际 运行 时 内 存 布 局 中 的 入 口 地 址 (相当 于 之 前 说 的 直接 
引用 ) 。 这 个 特性 给 Java 囊 来 了 更 强大 的 动态 扩展 能 力 ， 但 也 使 得 
Java 方 法 调用 过 程 变 得 相对 复杂 起 来 ， 需 要 在 类 加 载 期 间 ， 甚 至 到 运 
行 期 间 才 能 确定 目标 方法 的 直接 引用 。 


8.3.1 解析 


继续 前 面 关 于 方法 调用 的 话题 ， 所 有 方法 调用 中 的 目标 方法 在 
Class 文 件 里 面 都 是 一 个 常量 池 中 的 符号 引用 ， 在 类 加 载 的 解析 阶段 ， 
会 将 其 中 的 一 部 分 符号 引用 转化 为 直接 引用 ， 这 种 解析 能 成 立 的 前 提 
是 : 方法 在 程序 真正 运行 之 前 就 有 一 个 可 确定 的 调用 版 本 ， 并 且 这 个 
方法 的 调用 版 本 在 运行 期 是 不 可 改变 的 。 换 句 话 说， 调用 目标 在 程序 
代码 写 好 、 编 译 器 进行 编译 时 就 必须 确定 下 来 。 这 类 方法 的 调用 称 为 
解析 (Resolution) 。 


在 Java 语 言 中 符合 “编译 期 可 知 ， 运 行 期 不 可 变 ” 这 个 要 求 的 方 
法 ， 主 要 包括 静态 方法 和 私有 方法 两 大 类 ， 前 者 与 类 型 直接 关联 ， 后 
者 在 外 部 不 可 被 访问 ， 这 两 种 方法 各 目的 特点 决定 了 它们 都 不 可 能 通 
过 继承 或 别 的 方式 重 写 其 他 版 本 ， 因 此 它们 都 适合 在 类 加 载 阶 段 进行 
解析 。 


与 之 相对 应 的 是 ， 在 Java 虚 拟 机 里 面 提供 了 5 条 方法 调用 字 市 码 指 
pa ee 


心 


invokestatic: 调用 静态 方法 。 

invokespecial: 调用 实例 构造 右 <init> 方 法 、 私 有 方法 和 父 类 方 
法 3 

invokevirtual: 调用 所 有 的 虚 方 法 。 


invokeinterface: 调用 接口 方法 ， 会 在 运行 时 再 确定 一 个 实现 此 接 
口 的 对 象 。 


invokedynamic: 先 在 运行 时 动态 解析 出 调用 点 限定 符 所 引用 的 方 
法 ， 然 后 再 执行 该 方法 ， 在 此 之 前 的 4 条 调用 指令 ， 分 派 逻 辑 是 固化 在 
Java 虚 拟 机 内 部 的 ， 而 invokedynamic 指 令 的 分 派 逻 辑 是 由 用 户 所 设 定 
的 引导 方法 决定 的 。 


只 要 能 被 invokestatic 和 invokespecial 指 令 调用 的 方法 ， 都 可 以 在 解 
析 阶 段 中 确定 唯一 的 调用 版 本 ， 符 合 这 个 条 件 的 有 静态 方法 、 私 有 方 
法 、 实 例 构 造 器 、 父 类 方法 4 类 ， 它 们 在 类 加 载 的 时 候 就 会 把 符号 引用 
解析 为 该 方法 的 直接 引用 。 这 些 方法 可 以 称 为 非 虚 方法 ， 与 之 相反 ， 
其 他 方法 称 为 虚 方 法 (除去 final 方 法 ， 后 文 会 提 到 ) 。 代 码 清单 8-5 演 
示 了 一 个 最 常见 的 解析 调用 的 例子 ， 此 样 例 中 ， 静 态 方法 sayHello0 只 
可 能 属于 类 型 StaticResolution， 没 有 任何 手段 可 以 履 六 或 隐藏 这 个 方 
决 六 


代码 清单 8-5 方法 静态 解析 演示 


/A 
* 方 法 静态 解析 演示 


*Q@author zzm 

*/ 

public class StaticResolutiont{ 
public static void sayHello(){ 
System.out.println ("hello world") ; 


public static void main (String[]args) { 
StaticResolution.sayHello( ); 

} 

} 


使 用 javap 命 令 查看 这 段 程序 的 字 节 人 码 ， 会 发 现 的 确 是 通过 
invokestatic 命 令 来 调用 sayHello0) 方 法 的 。 
D:\Develop\>javap-verbose StaticResolution 


public static void main (java.lang.String[]) : 
Code: 


Stack=0, Locals=1, Args_size=1 
0:invokestatic#31; //Method sayHello:()V 
3:return 

LineNumberTable: 

line 15:0 

line 16:3 


Java 中 的 非 虚 方 法 除了 使 用 invokestatic、invokespecial 调 用 的 方法 
之 外 还 有 一 种 ， 就 是 被 final 修 饰 的 方法 。 虽 然 final 方 法 是 使 用 
invokevirtual 指 令 来 调用 的 ， 但 是 由 于 它 无 法 被 覆盖 ， 没 有 其 他 版 本 ， 
所 以 也 无 须 对 方法 接收 者 进行 多 态 选 择 ， 又 或 者 说 多 态 选择 的 结果 肯 
定 是 唯一 的 。 在 Java 语 言 规范 中 明确 说 明了 final 方 法 是 一 种 非 虚 方 
法 。 


解析 调用 一 定 是 个 静态 的 过 程 ， 在 编译 期 间 束 完全 确定 ， 在 类 净 
载 的 解析 阶段 瑟 会 把 涉及 的 符号 引用 全 部 转变 为 可 确定 的 直接 引用 ， 
不 会 延迟 到 运行 期 再 去 完成 。 而 分 派 (Dispatch) 调用 则 可 能 是 静态 
的 也 可 能 是 动态 的 ， 根 据 分 派 依据 的 宗 量 数 中 可 分 为 单 分 派 和 多 分 
派 。 这 两 类 分 派 方式 的 两 两 组 合 束 构成 了 静态 单 分 派 、 静 仿 多 分 派 、 
动态 单 分 派 、 动 态 多 分 派 4 种 分 派 组 合 情 况 ， 下 面 我 们 再 看 看 虚拟 机 中 
的 方法 分 派 是 如 何 进行 的 。 


[1] 这 里 涉及 的 分 派 的 相关 概念 (如 “ 宗 量 ”等 ) 在 后 文中 都 会 有 所 解 


8.3.2 ”分派 


众所周知 ，Java 是 一 门面 向 对 象 的 程序 语言 ， 因 为 Java 具 备 面向 对 
象 的 3 个 基本 特征 : 继承、 封装 和 多 态 。 本 市 讲解 的 分 派 调用 过 程 将 会 
揭示 多 态 性 特征 的 一 些 最 基本 的 体现 ， 如 “ 重 载 *? 和 “ 重 写 ” 在 Java 虚 拟 机 
之 中 是 如 何 实现 的 ， 这 里 的 实现 当然 不 是 语法 上 该 如 何 写 ， 我 们 关心 
的 依然 是 虚拟 机 如 何 确定 正确 的 目标 方法 。 


1. 静 人 态 分 派 


在 开始 讲解 静态 分 派 趾 前 ， 笔 者 准备 了 一 段 经 常 出 现在 面试 题 中 的 
程序 代码 ， 读 者 不 妨 先 看 一 裔 ， 想 一 下 程序 的 输出 结果 是 什么 。 后 面 
我 们 的 话题 将 围绕 这 个 类 的 方法 来 重 载 (Overload) 代码 ， 以 分 析 虚 拟 
机 和 编译 句 确 定 方 法 版 本 的 过 程 。 方 法 静态 分 派 如 代码 清早 8-6 所 示 。 


代码 清单 8-6 方法 静态 分 派 演示 


package org.fenixsoft.polymorphic; 
/A* 


* 方 法 静态 分 派 演示 
*Q@author zzm 


public class StaticDispatcht{ 
static abstract class Humant{ 


static class Man extends Humant{ 
static class Woman extends Humant{ 


public void sayHello (Human guy) { 


System.out.println ("hello,guy! ") ; 


public void sayHello (Man guy) { 
System.out.println ("hello,gentleman! ") ; 
} 

public void sayHello (Woman guy) { 
System.out.println ("hello,lady! ") ; 


public static void main (String[]args) { 
Human man=new Man(); 

Human woman=new Woman( ) ; 

StaticDispatch sr=new StaticDispatch( ); 
sr.sayHello (man) ; 

sr.sayHello (woman) ; 

} 

} 


运行 结 采 : 


hello, guy! 
hello, guy! 


代码 清单 8-6 中 的 代码 实际 上 是 在 考验 阅读 者 对 重 载 的 理解 程度 ， 
相信 对 Java 编 程 稍 有 经 验 的 程序 员 看 完 程序 后 都 能 得 出 正确 的 运行 结 
果 ， 但 为 什么 会 选择 执行 参数 类 型 为 Human 的 重 载 呢 ? 在 解决 这 个 问 
题 之 前 ， 我 们 先 按 如 下 代码 定义 两 个 重要 的 概念 。 


Human man=new Man( ) ; 


我 们 把 上 面 代码 中 的 "Human" 称 为 变量 的 静态 类 型 〈Static 
Type) ， 或 者 叫做 的 外 观 类 型 (Apparent Type) ， 后 面 的 "Man" 则 称 为 
变量 的 实际 类 型 (Actual Type) ， 静 态 类 型 和 实际 类 型 在 程序 中 都 可 
以 发 生 一 些 变化 ， 区 别 是 静态 类 型 的 变化 仅仅 在 使 用 时 发 生 ， 变 量 本 


号 的 静态 类 型 不 会 极 改 变 ， 并 且 最 终 的 静态 类 型 是 在 编译 期 可 知 的 ; 
而 实际 类 型 变化 的 结果 在 运行 期 才 可 确定 ， 编 译 器 在 编译 程序 的 时 候 
并 不 知道 一 个 对 象 的 实际 类 型 是 什么 。 例 如 下 面 的 代码 : 


// 实 际 类 型 变化 

Human man=new Man(); 
man=new Woman( ) ; 

// 静 态 类 型 变化 

sr.sayHello ( (Man) man) 
sr.sayHello ( (Woman) man) 


解释 了 这 两 个 概念 ， 再 回 到 代码 清单 8-6 的 样 例 代码 中 。main() 里 
面 的 两 次 sayHello0 方 法 调用 ， 在 方法 接收 者 已 经 确定 是 对 象 "sr" 的 前 提 
下 ， 使 用 哪个 重 载 版 本 ， 就 完全 取决 于 传 入 参数 的 数量 和 数据 类 型 。 
代码 中 刻意 地 定义 了 两 个 静态 类 型 相同 但 实际 类 型 不 同 的 变量 ， 但 虚 
拟 机 (准确 地 说 是 编译 器 ) 在 重 载 时 是 通过 参数 的 静态 类 型 而 不 是 实 
际 类 型 作为 判定 依据 的 。 并 且 议 态 类 型 是 编译 期 可 知 的 ， 因 此 ， 在 编 
译 阶 段 ，Javac 编 译 占 会 根据 参数 的 静态 类 型 决定 使 用 哪个 重 载 版 本 ， 
所 以 选择 了 sayHello (Human) 作为 调用 目标 ， 并 把 这 个 方法 的 符号 引 
用 写 到 main() 方 法 里 的 两 条 invokevirtual 指 令 的 参数 中 。 


所 有 依赖 静态 类 型 来 定位 方法 执行 版 本 的 分 派 动 作 称 为 脐 态 分 
派 。 静 仿 分 派 的 典型 应 用 下 方法 重 载 。 静 态 分 派发 生 在 编译 阶段 ， 因 
此 确定 静态 分 派 的 动作 实际 上 不 是 由 虚拟 机 来 执行 的 。 男 外 ， 编 译 右 
虽然 能 确定 出 方法 的 重 载 版 本 ， 但 在 很 多 情况 下 这 个 重 载 版 本 并 不 


是 “唯一 的 ”， 


住 住 只 


能 确定 一 个 “更 加 合适 的 ”版 本 。 


这 种 模糊 的 结论 在 


由 0 和 1 构成 的 计算 机 世界 中 算是 比较 “稀罕 ”的 事情 ， 产 生 这 种 模糊 结 


论 的 主要 原因 是 字 
它 的 静态 类 型 只 能 


型 


党 示 了 何 为 “更 加 合 


量 不 需要 定义 ， 所 以 字面 量 没 有 显 式 的 静态 类 
过 语言 上 的 规则 去 理解 和 推断 。 代 码 清单 8-7 


适 的 ”版 本 。 


代码 清单 8-7 重 载 方法 匹配 优先 级 


package org.fenixsoft.polymorphic; 
class Overloadt{ 


public 
public 


System . 


} 
public 


System . 


} 
public 


System . 


} 
public 


System . 


} 
public 


System . 


} 
public 


System . 


} 
public 
System 


} 
public 


static void 
out .println 


static void 
out .println 


static void 
out .println 


static void 
out ,println 


static void 
out .println 


static void 
out .println 


static void 


,Out .println 


static void 


sayHello ('a'); 


} 
} 


上 面 的 代码 运 4 


sayHello (Object arg) { 
("hello object") ; 


sayHello (int arg) { 
("hello int'") ; 


sayHello (long arg) { 
("hello long") ; 


sayHello (Character arg) { 
("hello Character") ; 


sayHello (char arg) { 
("hello char") ; 


sayHello (char..arg) { 
("hello char....") ; 


sayHello (Serializable arg) { 
("hello Serializable") ; 


main (String[]args) { 


了 后 会 输出 : 


hello char 


这 很 好 理解 ，'a 是 一 个 char 类 型 的 数据 ， 目 然 会 寻找 参数 类 型 为 
char 的 重 载 方法 ， 如 果 注 释 掉 sayHello (char arg) 方法 ， 那 输出 会 变 
为 : 

hello int 

这 时 发 生 了 一 次 目 动 类 型 转换 ，'a 除 了 可 以 代表 一 个 字符 串 ， 还 可 
以 代表 数字 97 (字符 'a' 的 Unicode 数 值 为 十 进 制 数 字 97) ， 因 此 参数 类 
型 为 int 的 重 载 也 是 合适 的 。 我 们 继续 注释 掉 sayHello (int arg) 方法 ， 
那 输出 会 变 为 : 


hello long 


这 时 发 生 了 两 次 自动 类 型 转换 ，'a' 转 型 为 整数 97 之 后 ， 进 一 步 转型 
为 长 整数 97L， 匹 配 了 参数 类 型 为 long 的 重 载 。 笔 者 在 代码 中 没有 写 其 
他 的 类 型 如 float、double 等 的 重 载 ， 不 过 实际 上 自动 转型 还 能 继续 发 生 
多 次 ， 按 照 char >int->long->float- > double 的 顺序 转型 进行 匹配 。 但 
` 会 匹配 到 byte 和 short 类 型 的 重 载 ， 因 为 char 鲁 byte 或 short 的 转型 是 不 
安全 的 。 我 们 继续 注释 掉 sayHello (long arg) 方法 ， 那 输出 会 变 为 : 


hello Character 


这 时 发 生 了 一 次 目 动 装 箱 ，'a 被 包装 为 它 的 封装 类 型 
java.lang.Character， 所 以 匹配 到 了 参数 类 型 为 Character 的 重 载 ， 继 续 注 
释 掉 sayHello (Character arg) 方法 ， 那 输出 会 变 为 : 


hello Serializable 


这 个 输出 可 能 会 让 人 感觉 摸 不 着 头脑 ， 一 个 字符 或 数字 与 序列 化 
有 什么 关系 ? 出 现 hello Serializable， 有 是 因为 java.lang.Serializable 是 
java.lang.Character 类 实现 的 一 个 接口 ， 当 目 动 装 箱 之 后 发 现 还 是 找 不 到 
疤 箱 类 ， 但 是 找到 了 闭 箱 类 实现 了 的 接口 类 型 ， 所 以 紧 接 着 又 发 生 
次 目 动 转型 。char 可 以 转型 成 int， 但 是 Character 是 绝对 不 会 转型 为 
Integer 的 ， 它 只 能 安全 地 转型 为 它 实 现 的 接口 或 父 类 。Character 还 实现 
了 男 外 一 个 接口 java.lang.Comparable < Character > ， 如 果 同 时 出 现 两 个 
参数 分 别 为 Serializable 和 Comparable< Character > 的 重 载 方法 ， 那 它们 
在 此 时 的 优先 级 是 一 样 的 。 编 译 如 无 法 确定 要 目 动 转型 为 哪 种 类 型 ， 
会 提示 类 型 模糊 ， 拒 绝 编译 。 程 序 必 须 在 调用 时 显 式 地 指定 字面 量 的 
静态 类 型 ， 如 : sayHello ( (Comparable <Character>) 'a) ， 才 能 编 
译 通 过 。 下 面 继续 注释 掉 sayHello (Serializable arg) 方法 ， 输 出 会 变 
为 : 


hello Object 


这 时 是 char 疙 箱 后 转型 为 父 类 了 ， 如 果 有 多 个 父 类 ， 那 将 在 继承 天 
系 中 从 下 往 上 开始 搜索 ， 越 授 近 上 层 的 优先 级 越 低 。 即 使 方法 调用 传 
入 的 参数 值 为 null 时 ， 这 个 规则 仍然 适用 。 我 们 把 sayHello (Object 
arg) 也 注释 掉 ， 输 出 将 会 变 为 : 


hello char...... 


7 个 重 载 方法 已 经 被 注释 得 只 剩 一 个 了 ， 可 见 变 长 参数 的 重 载 优先 
级 是 最 低 的 ， 这 时 候 了 字符 'a' 被 当做 了 一 个 数组 元 素 。 笔 着 使 用 的 是 char 
类 型 的 变 长 参数 ， 读 者 在 验证 时 还 可 以 选择 int 类 型 、Character 类 型 、 
Object 类 型 等 的 变 长 参数 重 载 来 把 上 面 的 过 程 重 新 演示 一 般 。 但 要 注意 
的 是 ， 有 一 些 在 单个 参数 中 能 成 立 的 目 动 转型 ， 如 char 转 型 为 int， 在 变 
长 参数 中 是 不 成 立 的 二 。 


代码 清单 8-7 演 示 了 编译 期 间 选 择 静 仿 分 派 目 标的 过 程 ， 这 个 过 程 
也 是 Java 语 言 实现 方法 重 载 的 本 质 。 演 示 所 用 的 这 段 程序 属于 很 极端 的 
例子 ， 除了 用 做 面试 题 为 难 求职 着 以 外 ， 在 实际 工作 中 几乎 不 可 能 
实际 用 途 。 笔 者 拿 来 做 演示 仅仅 是 用 于 讲解 重 载 时 目标 方法 选择 的 过 
程 ， 大 部 分 情况 下 进行 这 样 极 端的 重 载 都 可 算是 真正 的 “关于 丁香 豆 的 
画 有 儿 种 写法 的 研究 ”。 无 论 对 重 载 的 认识 有 多 么 深刻 ， 一 个 合格 的 程 
序 员 都 不 应 该 在 实际 应 用 中 写 出 如 此 极端 的 重 载 代 码 。 


男 外 还 有 一 点 读者 可 能 比较 容易 混淆 : 笔者 讲述 的 解析 与 分 派 这 
两 者 之 间 的 关系 并 不 是 二 选 一 的 排他 关系 ， 它 们 古 在 不 同 层次 上 去 信 

` 确定 目标 方法 的 过 程 。 例 如 ， 前 面 说 过 ， 静 仿 方 法 会 在 类 加 载 期 
束 进 行 解析 ， 而 静态 方法 显然 也 十 可 以 拥有 重 载 版 本 的 ， 选 择 重 载 版 
本 的 过 程 也 古 通 过 议 仿 分 派 完 成 的 。 


了 解 了 静态 分 派 ， 我 们 接 下 来 看 一 下 动态 分 派 的 过 程 ， 它 和 多 态 
性 的 另外 一 个 重要 体现 ”一 一 重 写 (Override) 有 着 很 密切 的 关联 。 我 
们 还 是 用 前 面 的 Man 和 Woman 一 起 sayHello 的 例子 来 讲解 动态 分 派 ， 请 
看 代码 清单 8-8 中 所 示 的 代码 。 


代码 清单 8-8 ”方法 动态 分 派 演示 


package org.fenixsoft.polymorphic; 
/A** 


* 方 法 动态 分 派 演示 

*@author zzm 

*/ 

public class DynamicDispatcht{ 
static abstract class Humant{ 
protected abstract void sayHello():; 


static class Man extends Humant{ 
Q@Override 

protected void sayHello(){ 
System.out.println ("man Say hello") ; 


} 


static class Woman extends Humant{ 
Q@Override 
protected void sayHello(){ 


System.out.println ("woman say hello") 


public static void main (String[]args) { 
Human man=new Man(); 

Human woman=new Woman( ) ; 

man. sayHello( ); 

woman ,SayHe1]1o( ); 

man=new Woman( ); 

man. sayHello( ); 


man say hello 
woman say hello 
woman say hello 


这 个 运行 结果 相信 不 会 出 平 任何 人 的 意料 ， 对 于 习惯 了 面向 对 象 
思维 的 Java 程 序 员 会 觉得 这 是 完全 理所当然 的 。 现 在 的 问题 还 是 和 前 面 
的 一 样 ， 虚 拟 机 是 如 何 知 道 要 调用 哪个 方法 的 ? 


显然 这 里 不 可 能 再 根据 静 仿 类 型 来 决定 ， 因 为 静态 类 型 同样 都 旦 
Human 的 两 个 变量 man 和 woman 在 调用 sayHello() 方 法 时 执行 了 不 同 的 行 
为 ， 并 且 变 量 man 在 两 次 调用 中 执行 了 不 同 的 方法 。 导 致 这 个 现象 的 原 
因 很 明显 ， 有 是 这 两 个 变量 的 实际 类 型 不 同 ，Java 虚 拟 机 是 如 何 根据 实际 
类 型 来 分 派 方法 执行 版 本 的 呢 ? 我 们 使 用 javap 命 令 输出 这 段 代 码 的 字 
斑 码 ， 芝 旗 从 中 导 找 答案 ， 输 出 结 末 如 代码 清单 8-9 所 示 。 


代码 清单 8-9_ main(0) 方 法 的 字 节 码 


public static void main (java.lang.String[]) ; 

Code: 

Stack=2, Locals=3, Args_size=1 

0:new#t16; //class org/fenixsoft/polymorphic/Dynamic- 
Dispatch $Man 

3:dup 

4:invokespecial#18; //Method org/fenixsoft/polymorphic/Dynamic- 
Dispatch $Man."<init>":()V 

7:astore_1 

8:new#19; //class org/fenixsoft/polymorphic/Dynamic- 
Dispatch $Woman 

11:dup 

12:invokespecial#21; //Method 


org/fenixsoft/polymorphic/DynamicDispa 


tch $Woman."<init>":()V 

15:astore 2 

16:aload_ 1 

17:invokevirtual#22; //Method org/fenixsoft/polymorphic/Dynamic- 
Dispatch $Human.sayHello:()V 

20:aload_ 2 

21:invokevirtual#22; //Method org/fenixsoft/polymorphic/Dynamic- 
Dispatch $Human.sayHello:()V 

24:new#19; //class org/fenixsoft/polymorphic/Dynamic- 

Dispatch $woman 

27:dup 

28:invokespecial#21; //Method org/fenixsoft/polymorphic/Dynam 
icDispatch $Wwoman."<init>":()V 

31:astore_1 

32:aload_1 

33:invokevirtual#22; //Method org/fenixsoft/polymorphic/ 
DynamicDispatch $Human.sayHello:()V 

36:return 


0~15 行 的 字 节 人 码 是 准备 动作 ， 作 用 是 建立 man 和 woman 的 内 存 空 


则 、 调 用 Man 和 Woman 类 型 的 实例 构造 器 ， 将 这 两 个 实例 的 引用 存放 
在 第 1、2 个 局 部 变量 表 Slot 之 中 ， 这 个 动作 也 就 对 应 了 代码 中 的 这 两 


人 句 : 


Human man=new Man( ) ; 
Human woman=new Woman( ) ; 


接 下 来 的 16~21 句 是 关键 部 分 ，16、20 两 句 分 别 把 刚刚 创建 的 两 个 
对 象 的 引用 压 到 栈 顶 ， 这 两 个 对 象 是 将 要 执行 的 sayHello0) 方 法 的 所 有 
者 ， 称 为 接收 者 (Receiver) ; 17 和 21 句 是 方法 调用 指令 ， 这 两 条 调用 
日 令 单 从 字 节 码 角 度 来 看 ， 无 论 是 指令 (都 是 invokevirtual) 还 是 参数 

(都 是 常量 池 中 第 22 项 的 常量 ， 注 释 显 示 了 这 个 常量 是 

Human.sayHello0 的 符号 引用 ) 完全 一 样 的 ， 但 是 这 两 句 指令 最 终 执 行 
的 目标 方法 并 不 相同 。 原 因 束 需要 从 invokevirtual 指 令 的 多 态 查 找 过 程 
开始 说 起 ，invokevirtual 指 令 的 运行 时 解析 过 程 大 致 分 为 以 下 几 个 步 


又 


站 


1) 找到 操作 数 栈 顶 的 第 一 个 元 素 所 指向 的 对 象 的 实际 类 型 ， 记 作 


2) 如 果 在 类 型 C 中 找到 与 常量 中 的 描述 符 和 简单 名 称 都 相符 的 方 
法 ， 则 进行 访问 权限 校 验 ， 如 果 通 过 则 返回 这 个 方法 的 直接 引用 ， 查 
找 过 程 结 束 ; 如 果 不 通 过 ， 则 返回 java.lang.IllegalAccessError 异 常 。 


3) 否则 ， 按 照 继承 关系 从 下 往 上 依次 对 C 的 各 个 父 类 进行 第 2 步 的 
搜索 和 验证 过 程 。 


4) 如 果 始 终 没有 找到 合适 的 方法 ， 则 抛 出 


java.lang.AbstractMethodError 异 常 。 


由 于 invokevirtual 指 令 执行 的 第 一 步 就 是 在 运行 期 确定 接收 者 的 实 
际 类 型 ， 所 以 两 次 调用 中 的 invokevirtual 指 令 把 常量 池 中 的 类 方法 符号 
引用 解析 到 了 不 同 的 直接 引用 上 ， 这 个 过 程 束 是 Java 语 言 中 方法 重 写 的 
本 质 。 我 们 把 这 种 在 运行 期 根据 实际 类 型 确定 方法 执行 版 本 的 分 派 过 
程 称 为 动态 分 派 。 


3. 蛙 分 派 与 多 分 派 


方法 的 接收 着 与 方法 的 参数 统称 为 方法 的 宗 量 ， 这 个 定义 最 早 应 
该 来 源 于 《Java 与 模式 》 一 书 。 根 据 分 派 基 于 多 少 种 未 量 ， 可 以 将 分 派 
划分 为 单 分 派 和 多 分 派 两 种 。 香 分 派 旦 根据 一 个 宗 量 对 目标 方法 进行 


选择 ， 多 分 派 则 是 根据 多 于 一 个 未 量 对 目标 方法 进行 选择 。 


单 分 派 和 多 分 派 的 定义 读 起 来 抛 口 ， 从 字面 上 看 也 比较 抽象 ， 不 
过 对 照看 实例 看 束 不 难 理解 了 。 代 码 清 单 8-10 中 列举 了 一 个 Father 和 
Son 一 起 来 做 出 “一 个 艰难 的 决定 ”的 例子 。 


代码 清单 8-10” 单 分 派 和 多 分 派 


/大 
* 单 分 派 、 多 分 派 演示 
*@author zzm 


public class Dispatcht{ 

static class QQ{} 

static class_ 360{} 

public static class Fathert{ 

public void hardchoice (QQ arg) { 
System.out.println ("father choose qq"); 


public void hardChoice (_360 arg) { 
System.out.println ("father choose 360") ; 
} 

} 


public static class Son extends Fathert{ 
public void hardCchoice (QQ arg) { 
System.out.println ("son choose qq") ; 


public void hardchoice (_360 arg) { 
System.out.println ("son choose 360") ; 
} 

} 

public static void main (String[]args) { 
Father father=new Father( ); 

Father Son=new Son(); 
father.hardChoice (new 360()) ; 
son.hardChoice (new QQ()); 

} 

} 


运行 结 采 : 


father choose 360 
son choose qq 


在 main 画 数 中 调用 了 两 次 hardChoice() 方 法 ， 这 两 次 hardChoice() 方 
法 的 选择 结果 在 程序 输出 中 已 经 显示 得 很 清楚 了 。 


我 们 来 看 看 编译 阶 段 编 译 需 的 选择 过 程 ， 也 惑 是 静态 分 派 的 过 
程 。 这 时 选择 目标 方法 的 依据 有 两 点 : 一 是 静态 类 型 是 Father 还 是 
Son， 二 是 方法 参数 是 QQ 还 是 360。 这 次 选择 结果 的 最 终 产物 是 产生 了 
两 条 invokevirtual 指 令 ， 两 条 指令 的 参数 分 别 为 常量 池 中 指 癌 


Father.hardChoice (360) 及 Father.hardChoice (QQ) 方法 的 符号 引用 。 


因为 是 根据 两 个 未 量 进行 选择 ， 所 以 Java 语 言 的 静态 分 派 属于 多 分 派 类 
型 。 


再 看 看 运行 阶段 虚拟 机 的 选择 ， 也 就 是 动态 分 派 的 过 程 。 在 执 
行 "son.hardChoice (new QQO) "这 名 代码 时 ， 更 准确 地 说 ， 是 在 执行 
这 名 代码 所 对 应 的 invokevirtual 指 令 时 ， 由 于 编译 期 已 经 决定 目标 方法 
的 签名 必须 为 hardChoice (QQ) ， 虚 拟 机 此 时 不 会 关心 传递 过 来 的 参 
效 "QQ'" 到 展 是 “腾讯 QQ” 还 是 “奇瑞 QQ”， 因 为 这 时 参数 的 静态 类 型 、 
实际 类 型 都 对 方法 的 选择 不 会 构成 任何 影响 ， 唯 一 可 以 影响 虚拟 机 选 
择 的 因素 只 有 此 方法 的 接受 着 的 实际 类 型 是 Fatheri 还 是 Son。 因 为 只 有 
一 个 宗 量 作为 选择 依据 ， 所 以 Java 语 言 的 动态 分 派 属于 单 分 派 类 型 。 


根据 上 述 论 证 的 结果 ， 我 们 可 以 总 结 一 句 : 今天 (直至 还 未 发 布 
的 Java 1.8) 的 Java 语 言 是 一 门 静 态 多 分 派 、 动 态 单 分 派 的 语言 。 强 
调 “ 今 天 的 Java 语 言 " 是 因为 这 个 结论 未 必 会 恒久 不 要，C# 在 3.0 及 之 前 
的 版 本 与 Java 一 样 是 动态 单 分 派 语言 ， 但 在 C#4.0 中 引入 了 dynamic 类 型 
后 ， 就 可 以 很 方便 地 实现 动态 多 分 派 。 


按照 目前 Java 语 言 的 发 展 趋势 ， 它 并 没有 直接 变 为 动态 语言 的 迹 


象 ， 而 是 通过 内 置 动态 语言 (如 JavaScript) 执行 引擎 的 方式 来 满足 动 
态 性 的 需求 。 但 是 Java 虚 拟 机 层面 上 则 不 是 如 此 ， 在 JDK 1.7 中 实现 的 


JSR-292[4 里 面 就 已 经 开始 提供 对 动态 语言 的 支持 了 ，JDK 1.7 中 新 增 的 


invokedynamic 指 令 也 成 为 了 最 复杂 的 一 条 方法 调用 的 字 节 人 码 指令 ， 稍 
后 笔者 将 专门 讲解 这 个 JDK 1.7 的 新 特性 。 


4. 虚 拟 机 动态 分 派 的 实现 


前 面 介绍 的 分 派 过 程 ， 作 为 对 虚拟 机 概念 模型 的 解析 基本 上 已 经 
足够 了 ， 它 已 经 解决 了 虚拟 机 在 分 派 中 “会 做 什么 ”这 个 问题 。 但 是 虚 
拟 机 “具体 是 如 何 做 到 的 "， 可 能 各 种 虚拟 机 的 实现 剖 会 有 些 有 差别 。 


由 于 动态 分 派 是 非常 频繁 的 动作 ， 而 且 动 态 分 派 的 方法 版 本 选择 
过 程 需要 运行 时 在 类 的 方法 元 数据 中 搜索 合适 的 目标 方法 ， 因 此 在 虚 
拟 机 的 实际 实现 中 基于 性 能 的 考虑 ， 大 部 分 实现 都 不 会 真正 地 进行 如 
此 频繁 的 搜索 。 面 对 这 种 情况 ， 最 常用 的 “稳定 优化 ”手段 就 是 为 类 在 
方法 区 中 建立 一 个 虚 方 法 表 (Vritual Method Table， 也 称 为 vtable， 与 
此 对 应 的 ， 在 invokeinterface 执 行 时 也 会 用 到 接口 方法 表 
Method Table， 简 称 itable) ， 使 用 虚 方 法 表 索 引 来 代替 元 数据 查找 以 提 
高 性 能 。 我 们 先 看 看 代码 请 单 8-10 所 对 应 的 虚 方 法 表 结 构 示 例 ， 如 图 8- 


3 所 示 。 


Inteface 


Father 方 法 表 Son 方 法 表 


clone () 人 clone () 


equals (Object) 二 equals (Object) 


finalize () finalize () 


getClass () getClass () 


hashCode() java.lang.Object hashCode() 


notify () 的 类 型 数据 notify () 
大 一 1 
notifyAll () notifyAll () 


toString () toString () 


wait() wait() 
wait(long) wait (long) 
wait llong, int) 3$ NT wait (long, int) 


hardChoice (QQ) hardChoice (QQ) 
hardChoice ( 360) hardChoice ( 360) 


Father 的 
类 型 数据 


图 8-3 方法 表 结 构 


虚 方 法 表 中 存放 着 各 个 方法 的 实际 入 口 地 址 。 如 果 某 个 方法 在 子 
类 中 没有 被 重 写 ， 那 子 类 的 虚 方 法 表 里 面 的 地 址 入 口 和 父 类 相同 方法 
的 地 址 入 口 是 一 致 的 ， 痢 指 同 父 类 的 实现 入 口 。 如 果子 类 中 重 写 了 这 
个 方法 ， 子 类 方法 表 中 的 地 址 将 会 蔡 换 为 指 癌 于 类 实现 版 本 的 入 口 地 
址 。 图 8-3 中 ，Son 重 写 了 来 自 Father 的 全 部 方法 ， 因 此 Son 的 方法 表 没 
有 指 回 Father 类 型 数据 的 箭头 。 但 是 Son 和 Father 都 没有 重 写 来 自 Object 
的 方法 ， 所 以 它们 的 方法 表 中 所 有 从 Object 继承 来 的 方法 都 指 网 了 
Object 的 数据 类 型 。 


为 了 程序 实现 上 的 方便 ， 具有 相同 签名 的 方法 ， 在 父 类 、 子 类 的 
虚 方法 表 中 都 应 当 具 有 一 样 的 索引 序号 ， 这 样 当 类 型 变换 时 ， 仅 需要 
变更 查找 的 方法 表 ， 就 可 以 从 不 同 的 虚 方法 表 中 按 索引 转换 出 所 需 的 
入 口 地 址 。 


方法 表 一 般 在 类 加 载 的 连接 阶段 进行 初始 化 ， 准 备 了 类 的 变量 初 
台 值 后 ， 虚 拟 机 会 把 该 类 的 方法 表 也 初始 化 完毕 。 


上 文中 笔者 说 方法 表 是 分 派 调用 的 “稳定 优化 手段 ， 虚 拟 机 除了 
使 用 方法 表 之 外 ， 在 条 件 允 许 的 情况 下 ， 还 会 使 用 内 联 缓存 (Inline 
Cache) 和 基于 “类 型 继承 关系 分 析 ” (Class Hierarchy Analysis,CHA) 
技术 的 守护 内 联 (Guarded Inlining) 两 种 非 稳定 的 “激进 优化 ”手段 来 获 
得 更 高 的 性 能 ， 关 于 这 两 种 优化 技术 的 原理 和 运作 过 程 ， 读 者 可 以 参 
考 本 书 第 11 章 中 的 相关 内 容 。 


[严格 来 说 ，Dispatch 这 个 词 一 般 不 用 在 静态 环境 之 中 ， 英 文 技术 文档 
的 称呼 是 "Method Overload Resolution"， 但 国内 的 各 种 资料 都 普遍 将 这 
种 行为 翻译 成 “静态 分 派 ”， 特 此 说 明 。 

[2] 重 载 中 选择 最 合适 方法 的 过 程 ， 可 参见 Java 语 言 规范 的 815.12.2.5 
Choosing the Most Specific Method 章 节 。 

[3] 有 一 种 观点 认为 : 因为 重 载 是 静态 的 ， 重 写 是 动态 的 ， 所 以 只 有 重 
写 算是 多 态 性 的 体现 ， 重 载 不 算 多 态 。 笔 者 认为 这 种 争论 没有 意义 ， 
概念 仅仅 是 说 明 问 题 的 一 种 工具 而 已 。 


[4]JSR-292 : Supporting Dynamically Typed Languages on the Java 


Platform (Java 平 台 的 动态 语言 支持 ) 。 


8.3.3 ”动态 类 型 语言 文 持 


Java 虚 拟 机 的 字 市 码 指 令 集 的 数量 从 Sun 公 司 的 第 一 款 Java 虚 拟 机 
问世 至 JDK 7 来 临 之 前 的 十 余年 时 间 里 ， 一 直 没 有 发 生 任何 变化 。 随 
着 JDK 7 的 发 布 ， 字 万 码 指令 集 终于 迎 来 了 第 一 位 新 成 员 一 一 
invokedynamic 指 令 。 这 条 新 增 加 的 指令 是 JDK 7 实现 “动态 类 型 语 
言 ”(Dynamically Typed Language) 支持 而 进行 的 改进 之 一 ， 也 是 为 
JDK 8 可 以 顺利 实现 Lambda 表 达 式 做 技术 准备 。 在 本 下 中 ， 我 们 将 详 
细 讲 解 JDK 7 这 项 新 特性 出 现 的 前 因 后 果 和 它 的 深远 意义 。 


1. 动 态 类 型 语言 


在 介绍 Java 虚 拟 机 的 动态 类 型 语言 支持 之 前 ， 我 们 要 先 弄 明白 动 
态 类 型 语言 是 什么 ? 它 与 Java 语 言 、Java 虚 拟 机 有 什么 关系 ? 了 解 JDK 
1.7 提 供 动 态 类 型 语言 支持 的 技术 背景 ， 对 理解 这 个 语言 特性 是 很 有 必 


什么 是 动态 类 型 语言 (1? 动态 类 型 语言 的 关键 特征 是 它 的 类 型 检 
查 的 主体 过 程 是 在 运行 期 而 不 是 编译 期 ， 满 足 这 个 特征 的 语言 有 很 
多 ， 常 用 的 包括 : APL、Clojure、Erlang、Groovy、JavaScript、 


Jython、Lisp、Lua、PHP、Prolog、Python、Ruby、Smalltalk 和 Tcl 


等 。 相 对 的 ， 在 编译 期 就 进行 类 型 检查 过 程 的 语言 《如 C++ 和 Java 


和 
等 ) 就 是 最 常用 的 静态 类 型 语言 。 


觉得 上 面 定 义 过 于 概念 化 ? 那 我 们 不 妨 通 过 两 个 例子 以 最 浅显 的 
方式 来 说 明 什么 是 “在 编译 期 /运行 期 进行 ?和 什么 是 “类 型 检查 ”。 首 爷 
看 下 面 这 段 简单 的 Java 代 码 ， 它 是否 能 正常 编译 和 运行 ? 


public static void main (String[]args) { 
int[]j[j[jarray=new int[1][0][-1]; 


这 上段 代码 能 够 正常 编译 ， 但 运行 的 时 候 会 报 
NegativeArraySizeException 寞 常 。 在 Java 庶 拟 机 规范 中 明确 规定 了 
NegativeArraySizeException 是 一 个 运行 时 异常 ， 通 俗 一 点 来 说 ， 运 行 
时 异常 束 是 只 要 代码 不 运行 到 这 一 行 就 不 会 有 问题 。 与 运行 时 异常 相 
对 应 的 是 连接 时 异常 ， 例 如 很 常见 的 NoClassDefFoundError 便 属于 连 
接 时 异常 ， 即 使 会 导致 连接 时 异常 的 代码 放 在 一 条 无 法 执行 到 的 分 支 
路 径 上 ， 类 加 载 时 (Java 的 连接 过 程 不 在 编译 阶段 ， 而 在 类 加 载 阶 
段 ) 也 照样 会 抛 出 异常 。 


不 过 ， 在 C 语 言 中 ,含义 相同 的 代码 会 在 编译 期 报错 : 


int main (void) { 
int i[1][90][-1]; //Gcc 拒 绝 编译 ， 报 "size of array is negative" 
return 0; 


} 


由 此 看 来 ， 一 门 语言 的 哪 一 种 检查 行为 要 在 运行 期 进行 ， 哪 一 种 
检查 要 在 编译 期 进行 并 没有 必然 的 因 采 逻辑 关系 ， 天 键 旦 语言 规范 中 
人 为 规定 的 。 再 举 一 个 例子 来 解释 “类 型 检查 ”， 例 如 下 面 这 一 句 非常 
简单 的 代码 : 


obj.println ("hello wor1d") ; 
虽然 每 个 人 都 能 看 懂 这 行 代码 要 做 什么 ， 但 对 于 计算 机 来 说 ， 这 


一 行 代码 “ 没 头 没 尾 ” 是 无 法 执行 的 ， 它 需要 一 个 具体 的 上 下 文才 有 讨 
论 的 意义 。 


现在 假设 这 行 代码 是 在 Java 语 言 中 ， 并 且 变 量 obj 的 静态 类 型 为 
java.io.PrintStream， 那 变量 obj 的 实际 类 型 就 必须 是 PrintStream 的 子 类 
(实现 了 PrintStream 接 口 的 类 ) 才 是 合法 的 。 否 则 ， 哪 怕 obj 属 于 一 个 
确实 有 用 println (String) 方法 ， 但 与 PrintStream 接 口 没 有 继承 关系 ， 
代码 依然 不 可 能 运行 一 一 因为 类 型 检查 不 合法 。 


但 是 相同 的 代码 在 ECMAScript (JavaScript) 中 情况 则 不 一 样 ， 无 
论 obj 有 具体 是 何 种 类 型 ， 只 要 这 种 类 型 的 定义 中 确实 包含 有 printin 
(String) 方法 ， 那 方法 调用 便 可 成 功 。 


这 种 差别 产生 的 原因 是 Java 语 言 在 编译 期 间 已 将 printtn (String) 
方法 完整 的 符号 引用 (本 例 中 为 一 个 


CONSTANT InterfaceMethodref info 常 量 ) 生成 出 来 ， 作 为 方法 调用 
旨 令 的 参数 存储 到 Class 文 件 中 ， 例 如 下 面 这 段 代码 : 


invokevirtual#4; //Method java/io/PrintStream.printin: 
(Ljava/lang/String; )V 


这 个 符号 引用 包含 了 此 方法 定义 在 哪个 具体 类 型 之 中 、 方 法 的 名 
字 以 及 参数 顺序 、 参 数 类 型 和 方法 返回 值 等 信息 ， 通 过 这 个 符号 引 
用 ， 虚 拟 机 可 以 翻译 出 这 个 方法 的 直接 引用 。 而 在 ECMAScript 等 动 仿 
类 型 语言 中 ， 变 量 obj 本 身 是 没有 类 型 的 ， 变 量 obj 的 值 才 具 有 类 型 ， 
编译 时 最 多 只 能 确定 方法 名 称 、 参 数 、 返 回 值 这 些 信息 ， 而 不 会 去 确 
定 方法 所 在 的 具体 类 型 〈 即 方法 接收 者 不 固定 ) 。“ 变 量 无 类 型 而 变量 
值 才 有 类 型 ”这 个 特点 也 是 动态 类 型 语言 的 一 个 重要 特征 。 


了 解 了 动态 和 静 仿 类 型 语言 的 区 别 后 ， 也 许 读者 的 下 一 个 问题 束 
征 动态 、 静 态 类 型 语言 两 者 谁 更 好 ， 或 者 谁 更 加 先进 ? 这 种 比较 不 会 
有 确切 答案 ， 因 为 它们 都 有 目 己 的 优点 ， 选 择 哪 种 语言 是 需要 经 过 权 
衡 的 。 静 态 类 型 语言 在 编译 期 确定 类 型 ， 最 显著 的 好 处 是 编译 套 可 以 
提供 严 谍 的 类 型 检查 ， 这 样 与 类 型 相关 的 问题 能 在 编码 的 时 候 束 及 时 
发 现 ， 利 于 稳定 性 及 代码 达到 更 大 规模 。 而 动态 类 型 语言 在 运行 期 确 
定 类 型 ， 这 可 以 为 开发 人 员 提 供 更 大 的 灵活 性 ， 某 些 在 静态 类 型 语言 
中 需 用 大 量 “ 腓 肿 ? 代 码 来 实现 的 功能 ， 由 动态 类 型 语言 来 实现 可 能 会 
更 加 清晰 和 简 污 ， 请 晰 和 人 稍 涪 通 彰 也 束 意 味 厦 开发 效率 的 提升 。 


2.JDK 1.7 与 动态 类 型 


回 到 本 市 的 主题 ， 来 看 看 Java 语 言 、 虚 拟 机 与 动态 类 型 语言 之 间 
有 什么 关系 。Java 虚 拟 机 毫 无 疑问 是 Java 语 言 的 运行 平台 ， 但 它 的 使 
命 并 不 仅 限 于 此 ， 早 在 1997 年 出 版 的 《Java 虚 拟 机 规范 》 中 整 规划 了 
这 样 一 个 愿景 : “在 未 来 ， 我 们 会 对 Java 虚 拟 机 进行 适当 的 扩展 ， 以 便 
更 好 地 文 持 其 他 语言 运行 于 Java 虚 拟 机 之 上 ”*。 而 目前 确实 已 经 有 许多 
动态 类 型 语言 运行 于 Java 虚 拟 机 之 上 了 ， 如 Clojure、Groovy、Jython 和 
JRuby 等 ， 能 够 在 同一 个 虚拟 机 上 可 以 达到 静态 类 型 语言 的 严 谍 性 与 
动态 类 型 语言 的 灵活 性 ， 这 是 一 件 很 美妙 的 事情 。 


但 遗憾 的 是 ，Java 虚 拟 机 层面 对 动态 类 型 语言 的 文 持 一 直 都 有 所 
欠缺 ， 主 要 表现 在 方法 调用 方面 ，JDK 1.7 以 前 的 字 节 码 指令 集中 ，4 
条 方法 调用 指令 (invokevirtual 、invokespecial 、invokestatic、 
invokeinterface) 的 第 一 个 参数 都 是 被 调用 的 方法 的 符号 引用 

(CONSTANT_Methodref info 或 者 


CONSTANT _InterfaceMethodref_ info 常量 ) ， 前 面 已 经 提 到 过 ， 方 法 
的 符号 引用 在 编译 时 产生 ， 而 动态 类 型 语言 只 有 在 运行 期 才能 确定 接 
收 者 类 型 。 这 样 ， 在 Java 虚 拟 机 上 实现 的 动态 类 型 语言 就 不 得 不 使 用 
其 他 方式 (如 编译 时 留 个 占 位 符 类 型 ， 运 行 时 动态 生成 字 节 码 实 现 具 
体 类 型 到 占 位 符 类 型 的 适 配 ) 来 实现 ， 这 样 势必 让 动态 类 型 语言 实现 
的 复杂 度 增加 ， 也 可 能 带 来 额外 的 性 能 或 者 内 存 开 销 。 尽 管 可 以 利用 


一 些 办 法 (如 Call Site Caching) 让 这 些 开销 尽量 变 小 ， 但 这 种 底层 问 
题 终 归 是 应 当 在 虚拟 机 层次 上 去 解决 才 最 合适 ， 因 此 在 Java 虚 拟 机 层 
面 上 提供 动态 类 型 的 直接 支持 就 成 为 了 Java 平 台 的 发 展 趋势 之 一 ， 这 
就 是 JDK 1.7 (JSR-292) 中 invokedynamic 指 令 以 及 java.lang.invoke 包 
出 现 的 技术 背景 。 


3.java.lang.invoke 包 


JDK 1.7 实 现 了 JSR-292， 新 加 入 的 java.lang.invoke 包 [| 就 是 JSR- 

292 的 一 个 重要 组 成 部 分 ， 这 个 包 的 主要 目的 是 在 之 前 单纯 依靠 符号 引 
用 来 确定 调用 的 目标 方法 这 种 方式 以 外 ， 提 供 一 种 新 的 动态 确定 目标 
方法 的 机 制 ， 称 为 MethodHandle。 这 种 表达 方式 也 许 不 太 好 懂 ? 那 不 
妨 把 MethodHandle 与 C/C++ 中 的 Function Pointer， 或 者 C# 里 面 的 
Delegate 类 比 一 下 。 举 个 例子 ， 如 果 我 们 要 实现 一 个 带 谓 词 的 排序 画 
数 ， 在 C/C++ 中 常用 的 做 法 是 把 谓词 定义 为 函数 ， 用 函数 指针 把 谓词 
传递 到 排序 方法 ， 如 下 : 


void sort (int list[], const int size, int (*compare) (int,int) ) 


但 Java 语 言 做 不 到 这 一 点 ， 即 没有 办 法 单独 地 把 一 个 函数 作为 参 
数 进 行 传递 。 普 裔 的 做 法 是 设计 一 个 党 有 compare() 方 法 的 Comparator 
接口 ， 以 实现 了 这 个 接口 的 对 象 作为 参数 ， 例 如 Collections.sort() 束 是 
这 样 定 义 的 : 


void sort (List list,Comparator c) 


不 过 ， 在 拥有 Method Handle 之 后 ，Java 语 言 也 可 以 拥有 类 似 于 函 
数 指针 或 者 委托 的 方法 别名 的 工具 了 。 代 码 清 单 8-11 演 示 了 
MethodHandle 的 基本 用 途 ， 无 论 obj 是 何 种 类 型 〈 临 时 定义 的 ClassA 抑 
或 是 实现 PrintStream 接 口 的 实现 类 System.out) ， 都 可 以 正确 地 调用 到 
println() 方 法 。 


代码 清单 8-11 ” MethodHandle 演 示 


import static java.lang.invoke.MethodHandles.1lookup:; 
import java.1lang.invoke.MethodHandle:; 
import java.1lang.invoke.MethodType:; 
/Rs 

*JSR-292 Method Handle 基 础 用 法 演示 
*Q@author zzm 

4 

public class MethodHandleTestt{ 
static class ClassA{ 

public void println (String s) { 
System.out.println (s) 

} 


public static void main (String[]args) throws Throwable{ 

Object obj=System.currentTimeMillis( )%2==0?System.out:new 
ClassA( ); 

/* 无 论 obj 最 终 是 哪个 实现 类 ， 下 面 这 人 句 都 能 正确 调用 到 print1n 方 法 

getPrintlnMH (obj) .invokeExact ("icyfenix") ; 

} 

private static MethodHandle getPrintlnMH (Object reveiver) throws 
Throwablef{ 

/*MethodType: 代表 “方法 类 型 "， 包 含 了 方法 的 返回 值 (methodType( ) 的 第 一 个 参 
数 ) 和 具体 参数 (methodType( ) 第 二 个 及 以 后 的 参数 ) */ 

MethodType mt=MethodType.methodType (void.class,String.class) : 

/*10o0kup( ) 方 法 来 自 于 MethodHandles .lookup， 这 人 句 的 作用 是 在 指定 类 中 查找 符 
合 给 定 的 方法 名 称 、 方 法 类 型 ， 并 且 符 合 调用 权限 的 方法 句柄 */ 

/* 因 为 这 里 调用 的 是 一 个 虚 方 法 ， 按 照 Java 语 言 的 规则 ， 方 法 第 一 个 参数 是 隐 式 的 ， 代 
表 该 方法 的 接收 者 ， 也 即 是 this 指 向 的 对 象 ， 这 个 参数 以 前 是 放 在 参数 列表 中 进行 传递 的 ， 


而 现在 提供 了 bindTo( ) 方 法 来 完成 这 件 事 情 */ 
return lookup().findVirtual (reveiver.getclass(), "println", 
mt) .bindTo (reveiver) ; 


} 
} 


实际 上 ， 方 法 getPrintInMHO 中 模拟 了 invokevirtual 指 令 的 执行 过 
程 ， 只 不 过 它 的 分 派 逻辑 并 非 固 化 在 Class 文 件 的 字 节 码 上 ， 而 是 通过 
一 个 具体 方法 来 实现 。 而 这 个 方法 本 喘 的 返回 值 (MethodHandle 对 
象 ) ， 可 以 视 为 对 最 终 调 用 方法 的 一 个 “引用 ”。 以 此 为 基础 ， 有 了 
MethodHandle 就 可 以 写 出 类 似 于 下 面 这 样 的 函数 声明 : 


void sort (List list,MethodHandle compare) 


从 上 面 的 例子 可 以 看 出 ， 使 用 MethodHandle 并 没有 什么 困难 ， 不 
过 看 完 它 的 用 法 之 后 ， 读 者 大 概 束 会 产生 疑问 ， 相 同 的 事情 ， 用 反射 
不 是 早 整 可 以 实现 了 吗 ? 


确实 ， 仅 站 在 Java 语 言 的 角度 来 看 ，MethodHandle 的 使 用 方法 和 
效果 与 Reflection 有 众多 相似 之 处 ， 不 过 ， 它 们 还 是 有 以 下 这 些 区 别 : 


从 本 质 上 讲 ，Reflection 和 MethodHandle 机 制 都 是 在 模拟 方法 调 
用 ， 但 Reflection 是 在 模拟 Java 代 码 层次 的 方法 调用 ， 而 MethodHandle 
是 在 模拟 字 节 人 码 层 次 的 方法 调用 。 在 MethodHandles.lookup 中 的 3 个 方 
使 


invokestatic、invokevirtual&zinvokeinterface 和 invokespecial 这 几 条 字 闻 


findStatic()、findVirtual()、findSpecial0O 正 是 为 了 对 应 于 


码 指 令 的 执行 权限 校 验 行为 ， 而 这 些 瓜 层 细 市 在 使 用 Reflection API 时 
征 不 需要 关心 的 。 


Reflection 中 的 java.lang.reflect.Method 对 象 远 比 MethodHandle 机 , 制 
中 的 java.lang.invoke.MethodHandle 对 象 所 包含 的 信息 多 。 前 者 是 方法 
在 Java 一 端的 全 面 映像 ， 包 含 了 方法 的 签名 、 描 述 符 以 及 方法 属性 表 
中 各 种 属性 的 Java 端 表示 方式 ， 还 包含 执行 权限 等 的 运行 期 信息 。 而 
后 者 仅仅 包含 与 执行 该 方法 相关 的 信息 。 用 通俗 的 话 来 讲 ，Reflection 


是 重量 级 ， 而 MethodHandle 是 轻 量 级 。 


由 于 MethodHandle 古 对 字 市 码 的 方法 指令 调用 的 模拟 ， 所 以 理论 
上 虚拟 机 在 这 方面 做 的 各 种 优化 (如 方法 内 联 ) ， 在 MethodHandle 上 
也 应 当 可 以 采用 类 似 思 路 去 支持 〈 但 目前 实现 还 不 完善 ) 。 而 通过 反 
员 去 调用 方法 则 不 行 。 


MethodHandle 与 Reflection 除 了 上 面 列举 的 区 别 外 ， 最 关键 的 一 点 
还 在 于 去 掉 前 面 讨论 施加 的 前 提 “ 仅 站 在 Java 语 言 的 角度 来 看 ”: 
Reflection API 的 设计 目标 是 只 为 Java 语 言 服务 的 ， 而 MethodHandle 则 | 
设计 成 可 服务 于 所 有 Java 虚 拟 机 之 上 的 语言 ， 其 中 也 包括 Java 语 言 。 


4.invokedynamic 指 令 


本 市 一 开始 束 提 到 了 JDK 1.7 为 了 更 好 地 支持 动态 类 型 语言 ，3 引 入 
了 第 5 条 方法 调用 的 字 节 码 指 令 invokedynamic， 之 后 一 直 没 有 再 提 到 


它 ， 甚 至 把 代码 清单 8-11 中 使 用 MethodHandle 的 示例 代码 反 编 译 后 也 
\ 会 看 见 invokedynamic 的 号 影 ， 它 的 应 用 之 处 在 哪里 昵 ? 


在 某 种 程度 上 ，invokedynamic 指 令 与 MethodHandle 机 制 的 作用 是 
一 样 的 ， 都 是 为 了 解决 原 有 4 条 "invoke*" 指 令 方 法 分 派 规则 固化 在 虚 
拟 机 之 中 的 问题 ， 把 如 何 查找 目标 方法 的 决定 权 从 虚拟 机 转嫁 到 具体 
用 户 代码 之 中 ， 让 用 户 (包含 其 他 语言 的 设计 者 ) 有 更 高 的 自由 度 。 
而 且 ， 它 们 两 者 的 思路 也 是 可 类 比 的 ， 可 以 把 它们 想象 成 为 了 达成 同 
一 个 目的 ， 一 个 采用 上 层 Java 代 码 和 API 来 实现 ， 另 一 个 用 字 节 码 和 
Class 中 其 他 属性 、 常 量 来 完成 。 因此， 如 果 理 解 了 前 面 的 
MethodHandle 例 子 ， 那 么 理解 invokedynamic 指 令 也 并 不 困难 。 


一 处 含有 invokedynamic 指 令 的 位 置 都 称 做 “动态 调用 
点 ”(Dynamic Call Site) ， 这 条 指令 的 第 一 个 参数 不 再 是 代表 方法 符 


号 引用 的 CONSTANT Methodref info 常 量 ， 而 是 变 为 JDK 1.7 新 加 入 的 


CONSTANT _InvokeDynamic_info 常 量 ， 从 这 个 新 常量 中 可 以 得 到 3 项 
言 息 : 引导 方法 (Bootstrap Method， 此 方法 存放 在 新 增 的 
BootstrapMethods 属 性 中 ) 、 方 法 类 型 (MethodType) 和 名 称 。 引 导 方 
法 是 有 固定 的 参数 ， 并 且 返 回 值 是 java.lang.invoke.CallSite 对 象 ， 这 个 
代表 真正 要 执行 的 目标 方法 调用 。 根 据 
CONSTANT_InvokeDynamic_info 常 量 中 提供 的 信息 ， 虚 拟 机 可 以 找到 
并 且 执 行 引导 方法 ， 从 而 获得 一 个 CallSite 对 象 ， 最 终 调 用 要 执行 的 目 


标 方法 。 我 们 还 是 举 一 个 实际 的 例子 来 解释 这 个 过 程 ， 如 代码 清单 8- 
12 所 示 。 


代码 清单 8-12 ”invokedynamic 指 令 演示 


import static java.lang.invoke.MethodHandles.1lookup; 
import java.1lang.invoke.CallSite.; 
import java.lang.invoke.ConstantCallsSite.; 
import java.1lang.invoke.MethodHandle:; 
import java.1lang.invoke.MethodHandles.; 
import java.1lang.invoke.MethodType:; 
public class InvokeDynamicTest{ 
public static void main (String[]args) throws Throwablef{ 
INDY_BootstrapMethod().invokeExact ("icyfenix") ; 
} 
public static void testMethod (String s) { 
System.out.println ("hello String:"+s) ; 
} 
public static CallSite BootstrapMethod (MethodHandles .Lookup 
lookup, String name,MethodType mt) throws Throwablef 
return new Constantcallsite (Lookup.findStatic 
(InvokeDynamicTest.class,name,mt) ); 
} 
private static MethodType MT_BootstrapMethod( ){ 
return MethodType 
.fromMethodDescriptorstring ( 
" (Ljava/lang/invoke/MethodHandles $Lookup; Ljava/lang/String; 
Ljava/lang/invoke/MethodType; ) Ljava/lang/invoke/CallSite; ", 
null) ; 
} 
private static MethodHandle MH_BootstrapMethod( )throws 
Throwablef{ 
return lookup().findStatic 
(InvokeDynamicTest.class, "BootstrapMethod", 
MT_BootstrapMethod()) ; 
} 
private static MethodHandle INDY_BootstrapMethod( )throws 
Throwablef{ 
CallSite cs= (CallSite) MH_BootstrapMethod().invokeWwithArguments 
(lookup(), "testMethod", 
MethodType.fromMethodDescriptorString (" (Ljava/lang/String; ) 
V", Null) ) ; 
return cs.dynamicIinvoker(); 


oy 


这 上段 代码 与 前 面 MethodHandleTest 的 作用 基本 上 是 一 样 的， 虽然 
笔者 没有 加 以 注释 ， 但 是 阅读 起 来 应 当 不 困难 。 本 书 前 面 提 到 过 ， 由 
于 invokedynamic 指 令 所 面向 的 使 用 者 并 非 Java 语 言 ， 而 是 其 他 Java 虚 
拟 机 之 上 的 动态 语言 ， 因 此 仅 依靠 Java 语 言 的 编译 器 Javac 没 有 办 法 生 
成 带 有 invokedynamic 指 令 的 字 广 码 (曾经 有 一 个 
java.dyn.InvokeDynamic 的 语法 糖 可 以 实现 ， 但 后 来 被 取消 了 ) ， 所 以 
要 使 用 Java 语 言 来 演示 invokedynamic 指 令 只 能 用 一 些 变通 的 办 法 。 
John Rose (Da Vinci Machine Project 的 Leader) 编写 了 一 个 把 程序 的 字 
节 码 转换 为 使 用 pvokedynamic 的 简单 工具 INDYD 来 完成 这 件 事情 ， 
我 们 要 使 用 这 个 工具 来 产生 最 终 要 的 字 节 码 ， 因 此 这 个 示例 代码 中 的 
方法 名 称 不 能 随意 改动 ， 更 不 能 把 几 个 方法 合并 到 一 起 写 ， 因 为 它们 
是 要 被 INDY 工 具 读 取 的 。 


把 上 面 代 码 编译 、 再 使 用 INDY 转 换 后 重新 生成 的 字 节 码 如 代码 清 
单 8-13 所 示 (结果 使 用 javap 输 出 ， 因 版 面 原因 ， 精 简 了 许多 无 关 的 内 


de 


容 ) 
代码 清单 8-13 ”invokedynamic 指 令 演示 (2) 


Constant pool: 
#121=NameAndType#33:#30//testMethod: (Ljava/lang/String; ) V 
#123=InvokeDynamic#0:#121//#0:testMethod: (Ljava/lang/String; ) V 


public static void main (java.lang.String[]) throws 
java.1lang.Throwable; 
Code: 
stack=2, locals=1, args_size=1 
0:ldc#23//String abc 
2:invokedynamic#123, 0//InvokeDynamic#0:testMethod: 
(Ljava/lang/String; ) V 
7:nop 
8:return 
public static java.1lang.invoke.CallSite BootstrapMethod 
(java.lang.invoke.MethodHandles 
$Lookup, java.lang.Sstring, java.lang.invoke.MethodType) throws 
java.lang.Throwable; 
Code: 
stack=6, locals=3, args_size=3 
O:new#63//class java/lang/invoke/ConstantCcallsite 
:dup 
:aload_ 0 
:ldc#1//class org/fenixsoft/InvokeDynamicTest 
:aload 1 
:aload 2 
9:invokevirtual#65//Method java/lang/invoke/MethodHandles 
$Lookup .findStatic: (Ljava/lang/Class; Ljava/lang/Sstring; 
Ljava/lang/invoke/MethodType; ) Ljava/lang/invoke/MethodHandle: 
12:invokespecial#71//Method 
java/lang/invoke/ConstantCallSite."<in it>": 
(Ljava/lang/invoke/MethodHandle; ) V 
15:areturn 


oo ~I OUOI 上 


从 main() 方 法 的 字 市 码 可 见 ， 原 本 的 方法 调用 指令 已 经 营 换 为 
invokedynamic， 它 的 参数 为 第 123 项 常量 (第 二 个 值 为 0 的 参数 在 
HotSpot 中 用 不 到 ， 与 invokeinterface 指 令 那 个 值 为 0 的 参数 一 样 都 是 占 
1) 


~ 2:invokedynamic#123, 0//InvokeDynamic#0:testMethod: 
(Ljava/lang/String; ) V 


从 音量 池 中 可 见 ， 第 123 项 常量 显 


示 '"#123=InvokeDynamic#0:#121" 说 明 它 是 一 项 


CONSTANT_InvokeDynamic_info 类 型 常量 ， 常 量 值 中 前 面 的 “#02” 代 表 
引导 方法 取 BootstrapMethods 属 性 表 的 第 0 项 \javap 没 有 列 出 属性 表 的 
具体 内 容 ， 不 过 示例 中 仅 有 一 个 引导 方法 ， 即 BootstrapMethodO) ， 

而 后 面 的 "#121" 代 表 引 用 第 121 项 类 型 为 
CONSTANT_NameAndType_info 的 常量 ， 从 这 个 常量 中 可 以 获取 方法 
名 称 和 描述 符 ， 即 后 面 输出 的 "testMethod: (Ljava/lang/String; ) V"。 


再 看 一 下 BootstrapMethod()， 这 个 方法 Java 源 码 中 没有 ， 是 INDY 
产生 的 ， 但 是 它 的 字 市 码 很 容易 读 履 ， 所 有 远 辑 束 是 调用 
MethodHandles $Lookup 的 findStatic() 方 法 ， 产 生 testMethod() 方 法 的 
MethodHandle， 然 后 用 它 创 建 一 个 ConstantCallSite 对 象 。 最 后 ， 这 个 
对 象 返 回 给 invokedynamic 指 令 实 现 对 testMethod() 方 法 的 调用 ， 
invokedynamic 指 令 的 调用 过 程 到 此 就 宣告 完成 了 。 


5. 掌 控 方 法 分 派 规 则 


invokedynamic 指 令 与 前 面 4 条 "invoke*" 指 令 的 最 大 差别 就 是 它 的 
分 派 逻 辑 不 是 由 虚拟 机 决定 的 ， 而 是 由 程序 员 决 是 。 在 介绍 Java 虚 拟 
机 动态 语言 文 持 的 最 后 一 个 小 结 中 ， 笔 者 通过 一 个 简单 例子 《如 代码 
清单 8-14 所 示 ) ， 帮 助 读 者 理解 程序 员 在 可 以 掌控 方法 分 派 规则 之 
后 ， 能 做 什么 以 前 无 法 做 到 的 事情 。 


代码 清单 8-14 方法 调用 问题 


class GrandFathert{ 
void thinking(){ 
System,out.println ("i am grandfather") ; 


} 


class Father extends GrandFather{ 
void thinking()t{ 

System.out.println ("i am father") ; 
} 

} 

class Son extends Fathert{ 
void thinking()t{ 

// 请 读者 在 这 里 填 入 适当 的 代码 (不 能 修改 其 他 地 方 的 代码 ) 

// 实 现 调用 祖父 类 的 thinking( ) 方 法 ,打印 "i am grandfather" 
} 

} 


在 Java 程 序 中 ， 可 以 通过 "super" 关 键 字 很 方便 地 调用 到 父 类 中 的 
方法 ， 但 如 果 要 访问 祖 类 的 方法 呢 ? 读者 在 阅读 本 书 下 面 提 供 的 解决 
方案 之 前 ， 不 妨 目 己 思考 一 下 ， 在 JDK 1.7 之 前 有 没有 办 法 解决 这 个 问 


题 。 


在 JDK 1.7 之 前 ， 使 用 纯粹 的 Java 语 言 很 难处 理 这 个 问题 (直接 生 
成 字 节 码 就 很 简单 ， 如 使 用 ASM 等 字 节 码 工 具 ) ， 原 因 是 在 Son 类 的 
thinking0) 方 法 中 无 法 获取 一 个 实际 类 型 是 GrandFather 的 对 象 引 用 ， 而 
invokevirtual 指 令 的 分 派 逻 辑 就 是 按照 方法 接收 者 的 实际 类 型 进行 分 
派 ， 这 个 逻辑 是 固化 在 虚拟 机 中 的 ， 程 序 员 无 法 改变 。 在 JDK 1.7 中 ， 
可 以 使 用 代码 清单 8-15 中 的 程序 来 解决 这 个 问题 。 


代码 清单 8-15 ”使 用 MethodHandle 来 解决 相关 问题 


import static java.lang,invoke.MethodHandles,. Jookup; 
import java.1lang.invoke.MethodHandle:; 

import java.1lang.invoke.MethodType:; 

class Testt{ 

class GrandFathert{ 

void thinking()t{ 

System.out.printiln ("i am grandfather"); 


} 


class Father extends GrandFather{ 
void thinking()t{ 

System.out.println ("i am father") ; 
} 

} 


class Son extends Fathert{ 

void thinking()t{ 

try{ 

MethodType mt=MethodType.methodType (void.class) ; 

MethodHandle mh=lookup().findSpecial 
(GrandFather .class, "thinking", mt,getClass()); 

mh.invoke (this) ; 

}catch (Throwable e) { 

} 

} 

lL | 

public static void main (String[]args) { 

(new Test().new Son()) .thinking(); 


i am grandfather 


[1 注意， 动态 类 型 语言 与 动态 语言 、 弱 类 型 语言 并 不 是 一 个 概念 ， 需 


要 区 别 对 待 。 


[2] 这 个 包 在 很 长 一 段 时 间 里 称 为 java.dyn， 也 曾经 短暂 更 名 为 
java.lang.mh， 如 果 读 者 在 其 他 资料 上 看 到 这 两 个 包 名 ， 可 以 把 它们 理 
解 为 java.lang.invoke 。 

[3]INDY 下 载 地 址 


http://blogs.oracle.com/jrose/entry/a_modest_tool for writing。 


8.4 “基于 栈 的 字 节 码 解释 执行 引擎 


虚拟 机 是 如 何 调用 方法 的 内 容 已 经 讲解 完毕 ， 从 本 节 开 始 ， 我 们 
来 探讨 虚拟 机 是 如 何 执 行 方法 中 的 字 市 码 指 令 的 。 上 文中 提 到 过 ， 许 
多 Java 虚 拟 机 的 执行 引擎 在 执行 Java 代 码 的 时 候 都 有 解释 执行 (通过 人 解 
释 器 执行 ) 和 编译 执行 〈 通 过 即时 编译 器 产生 本 地 代码 执行 ) 两 种 选 
择 ， 在 本 章 中 ， 我 们 先 来 探讨 一 下 在 解释 执行 时 ， 虚 拟 机 执行 引擎 是 
如 何 工作 的 。 


8.4.1 解释 执行 


Java 语 言 经 常 被 人 们 定位 为 "解释 执行 ”的 语言 ， 在 Java 初 生 的 JDK 
1.0 时 代 ， 这 种 定义 还 算是 比较 准确 的 ， 但 当主 流 的 虚拟 机 中 都 包含 了 
即时 编译 器 后 ，Class 文 件 中 的 代码 到 底 会 被 解释 执行 还 是 编译 执行 ， 
就 成 了 只 有 虚拟 机 自己 才能 准确 判断 的 事情 。 再 后 来 ，Java 也 发 展 出 了 
可 以 直接 生成 本 地 代码 的 编译 器 [如 GCJI (GNU Compiler for the 
Java) ]， 而 C/C++ 语 言 也 出 现 了 通过 解释 器 执行 的 版 本 (如 
CINTI) ， 这 时 候 再 党 统 地 说 “解释 执行 ”， 对 于 整个 Java 语 言 来 说 就 成 
了 几乎 是 没有 意义 的 概念 ， 只 有 确定 了 谈论 对 象 是 某 种 具体 的 Java 实 现 
版 本 和 执行 引擎 运行 模式 时 ， 谈 解释 执行 还 是 编译 执行 才 会 比较 确 
切 。 


不 论 是 解释 还 是 编译 ， 也 不 论 古 物理 机 还 是 虚拟 机 ， 对 于 应 用 程 
序 ， 机 器 都 不 可 能 如 和 人 那样 阅读 、 理 解 ， 然 后 就 获得 了 执行 能 力 。 大 
部 分 的 程序 代码 到 物理 机 的 目标 代码 或 虚拟 机 能 执行 的 指令 集 之 前 ， 
都 需要 经 过 图 8-4 中 的 各 个 步骤 。 如 有 果 读 者 对 编译 原理 的 相关 课程 还 有 
印象 的 话 ， 很 容易 就 会 发 现 图 8-4 中 下 面 那 条 分 支 ， 束 是 传统 编译 原理 
中 程序 代码 到 目标 机 器 代 码 的 生成 过 程 ， 而 中 间 的 那 条 分 文 ， 自 然 就 
征 解 释 执 行 的 过 程 。 


如 今 ， 基 于 物理 机 、Java 虚 拟 机 ， 或 者 非 Java 的 其 他 高 级 语言 虚拟 
机 (HLLVM) 的 语言 ， 大 多 都 会 遵循 这 种 基于 现代 经 典 编译 原理 的 思 
路 ， 在 执行 前 先 对 程序 源码 进行 词法 分 析 和 语法 分 析 人 处理 ， 把 源码 转 
化 为 抽象 语法 树 (Abstract Syntax Tree,AST) 。 对 于 一 门 具体 语言 的 实 
现 来 说 ， 词 法 分 析 、 语 法 分 析 以 至 后 面 的 优化 器 和 目标 代码 生成 器 都 
可 以 选择 独立 于 执行 引擎 ， 形 成 一 个 完整 意义 的 编译 万 去 实现 ， 这 类 
代表 是 C/C++ 语 言 。 也 可 以 选择 把 其 中 一 部 分 步骤 (如 生成 抽象 语法 树 
之 前 的 步骤 ) 实现 为 一 个 半 独 立 的 编译 器 ， 这 类 代表 是 Java 语 言 。 又 或 
者 把 这 些 步骤 和 执行 引擎 全 部 集中 封装 在 一 个 封闭 的 黑匣子 之 中 ， 如 
大 多 数 的 JavaScript 执 行 器 。 


中 5 一 上 令 流 tr IEE 
解释 执行 解释 器 (可 选 ) 抽象 语法 树 
er Wr ]¢( 可 


图 8-4 编译 过 程 


Java 语 言 中 ，Javac 编 译 器 完成 了 程序 代码 经 过 词法 分 析 、 语 法 分 
析 到 抽象 语法 树 ， 再 人 裔 历 语 法 树 生成 线性 的 字 市 码 指 令 流 的 过 程 。 因 
为 这 一 部 分 动作 是 在 Java 虚 拟 机 之 外 进行 的 ， 而 解释 右 在 虚拟 机 的 内 
部 ， 所 以 Java 程 序 的 编译 就 是 半 独 立 的 实现 。 


[1IGCJ: http://gcc.gnu.org/java/ ° 


[2ICINT: http://root.cern.ch/drupal/content/cint ° 


8.4.2 ”基于 栈 的 指令 集 与 基于 寄存 需 的 指令 集 


Java 编 译 器 输出 的 指令 流 ， 基 本 上 由 是 一 种 基于 栈 的 指令 集 架构 
(Instruction Set Architecture,ISA) ， 指 令 流 中 的 指令 大 部 分 都 是 零 地 
址 指令 ， 它 们 依赖 操作 数 栈 进行 工作 。 与 之 相对 的 另外 一 套 常 用 的 指 
令 集 架构 是 基于 寄存 器 的 指令 集 ， 最 典型 的 就 是 x86 的 二 地 址 指令 集 ， 


说 得 通俗 一 些 ， 就 是 现在 我 们 主流 PC 机 中 直接 支持 的 指令 集 架 构 ， 这 
些 指令 依赖 寄存 右 进 行 工 作 。 那 么 ， 基 于 栈 的 指令 集 与 基于 寄存 右 的 
指令 集 这 两 者 之 间 有 什么 不 同 呢 ? 


举 个 最 简单 的 例子 ， 分 别 使 用 这 两 种 指令 集 计 算 “1+1” 的 结果 ， 基 
于 栈 的 指令 集会 是 这 样子 的 : 

iconst_1 

iconst_1 


iadd 
istore 0 


两 条 iconst_1 指 令 连 续 把 两 个 常量 1 压 入 栈 后 ，iadd 指 令 把 栈 顶 的 
两 个 值 出 栈 、 相 加 ， 然 后 把 结果 放 回 栈 顶 ， 最 后 istore_0 把 栈 顶 的 值 放 
到 局 部 变量 表 的 第 0 个 Slot 中 。 


如 果 基 于 寄存 器 ， 那 程序 可 能 会 是 这 个 样子 : 


mov eax, 1 


add eax, 1 


mov 指 令 把 EAX 寄存 器 的 值 设 为 |， 然后 add 指 令 再 把 这 个 值 加 1， 
结果 就 保存 在 EAX 寄存 器 里 面 。 


了 解 了 基于 栈 的 指令 集 与 基于 寄存 器 的 指令 集 的 区 别 后 ， 读 者 可 
能 会 有 进一步 的 疑问 ， 这 两 套 指令 集 谁 更 好 一 些 昵 ? 


应 该 这 么 说 ， 既 然 两 套 指 令 集会 同时 并 存 和 发 展 ， 那 肯定 是 各 有 
优势 的 ， 如 果 有 一 套 指 令 集 全 面 优 于 男 外 一 套 的 话 ， 束 不 会 存在 选择 
的 问题 了。 


基于 栈 的 指令 集 主要 的 优点 殊 是 可 移植 ， 寄 存 器 由 便 件 直接 提供 
中 ,程序 直 接 依赖 这 些 硬件 寄存 器 则 不 可 避免 地 要 受到 硬件 的 约束 。 
例如 ， 现 在 32 位 80x86 体 系 的 处 理 器 中 提供 了 8 个 32 位 的 寄存 器 ， 而 
ARM 体 系 的 CPU 《在 当前 的 手机 、PDA 中 相当 流行 的 一 种 处 理 器 ) 则 
提供 了 16 个 32 位 的 通用 寄存 器 。 如 有 果 使 用 栈 染 构 的 指令 集 ， 用 户 程 序 
` 会 直接 使 用 这 些 寄存 器 ， 束 可 以 由 虚拟 机 实现 来 目 行 决定 把 一 些 访 
问 最 频繁 的 数据 (程序 计数 器 、 栈 顶 缓存 等 放 到 寄存 器 中 以 获取 尽 
量 好 的 性 能 ， 这 样 实现 起 来 也 更 加 信 单 一 些 。 栈 架构 的 指令 集 还 有 一 
些 其 他 的 优点 ， 如 代码 相对 更 加 紧 兰 ( 字 节 码 中 每 个 字 节 就 对 应 一 条 
指令 ， 而 多 地 址 指令 集中 还 需要 存放 参数 ) 、 编 译 器 实现 更 加 简单 
(不 需要 考虑 空间 分 配 的 问题 ， 所 需 空间 都 在 栈 上 操作 ) 等 。 


栈 以 构 指 令 集 的 主要 缺点 是 执行 速度 相对 来 说 会 稍 慢 一 些 。 所 有 
主流 物理 机 的 指令 集 痢 是 寄存 器 以 构 也 从 侧面 印证 了 这 一 点 。 


里 然 栈 架构 指令 集 的 代码 非常 紧 冯 ， 但 是 完成 相同 功能 所 需 的 指 
令 数 量 一 般 会 比 寄 存 紫 架构 多 ， 因 为 出 栈 、 入 栈 操 作 本 身 束 产生 了 相 
当 多 的 指令 数量 。 更 重要 的 是 ， 栈 实现 在 内 存 之 中 ， 频 繁 的 栈 访问 也 
就 意味 痢 频 繁 的 内 存 访 问 ， 相 对 于 处 理 融 来 说 ， 内 存 始 终 是 执行 速度 
的 瓶 绒 。 尽 管 虚 拟 机 可 以 采取 栈 顶 缓存 的 手段 ， 把 最 种 用 的 操作 映射 
到 寄存 器 中 避免 直接 内 存 访问 ， 但 这 也 只 能 是 优化 措施 而 不 是 解决 本 
质问 题 的 方法 。 由 于 指令 数量 和 内 存 访问 的 原因 ， 所 以 导致 了 栈 架 构 
指令 集 的 执行 速度 会 相对 较 慢 。 


[1] 使 用 “基本 上 ”*， 是 因为 部 分 字 节 码 指 令 会 这 有 参数 ， 而 纯粹 基于 栈 
的 指令 集 架 构 中 应 当 全 部 都 是 零 地 址 指令 ， 也 就 是 都 不 存在 显 式 的 参 
数 。Java 这 样 实现 主要 是 考虑 了 代码 的 可 校 验 性 。 

[2] 这 里 说 的 是 物理 机 器 上 的 寄存 器 ， 也 有 基于 寄存 器 的 虚拟 机 ， 如 
Google Android 平 台 的 Dalvik VM。 即 使 是 基于 寄存 器 的 虚拟 机 ， 也 和希 
望 把 虚拟 机 寄存 器 尽量 映射 到 物理 寄存 器 上 以 获取 尽 可 能 高 的 性 能 。 


8.4.3 ”基于 栈 的 解释 天 执行 过 程 


初步 的 理论 知识 已 经 讲解 过 了 ， 本 节 谁 备 了 一 段 Java 代 码 ， 看 看 
在 虚拟 机 中 实际 是 如 何 执 行 的 。 前 面 曾经 举 过 一 个 计算 “1+1” 的 例子 ， 
这 样 的 算术 题目 显然 太 过 简单 了 ， 笔 者 准备 了 四 则 运算 的 例子 ， 请 看 
代码 清单 8-16 。 


代码 清单 8-16 ”一段 简单 的 算术 代码 


public int calc(){ 
int a=100; 

int b=200; 

int c=300; 

return (at+b) *c; 


} 


从 Java 语 言 的 角度 来 看 ， 这 段 代 码 没有 任何 解释 的 必要 ， 可 以 直 
接 使 用 javap 命 令 看 看 它 的 字 节 码 指令 ， 如 代码 清单 8-17 所 示 。 


代码 清单 8-17 一 段 简单 的 算术 代码 的 字 市 码 表示 


public int calc(); 

Code: 

Stack=2, Locals=4, Args_size=1 
:bipush 100 

:istore 1 

:SIpush 200 

:istore 2 

:SIpush 300 

10:istore_3 

11:iload 1 


NOOWNO 


12:iload 2 
13:iadd 
14:iload_3 
15:imul 
16:ireturn 


javap 提 示 这 上 段 代码 需要 深度 为 2 的 操作 数 栈 和 4 个 Slot 的 局 部 变量 
空间 ， 笔 者 根据 这 些 信息 画 了 图 8-5~ 图 8-11 共 7 张 图 ， 用 它们 来 描述 代 
码 请 单 8-17 执 行 过 程 中 的 代码 、 操 作 数 栈 和 局 部 变量 表 的 变化 情况 。 


istore_l 
sipush 200 参数 ， 指 明 推 送 的 常量 值 ， 
里 是 100 


程序 计数 器 首先 执行 偶 移 地 址 为 0 的 指 
偏 移 助 记 符 令 ，bipush 指 令 的 作用 是 将 单字 
[Lo | 节 的 整 型 常量 值 ( -128~127 
推 人 操 作 数 栈 顶 ， 跟 随 有 一 


) 
个 
这 


istore 2 
sipush 300 
istore 3 
iload 1 
iload_2 
iadd 
iload 3 
imul 


8-5 ”执行 偏 移 地 址 为 0 的 指令 的 情况 


助 记 符 程序 计数 如 执行 偏 移 地 址 为 2 的 指 Es ; 
istore_1 指 令 的 作用 是 将 操作 数 
bipush 100 [2 |] 里” 栈 项 的 整 型 值 出 栈 并 存放 到 第 1 


istere1 | 


个 局 部 变量 Slot 中 。 后 续 4 条 指 
sipush 200 令 ( 直到 偏 移 为 11 的 指 今 为 止 ) 
都 是 做 一 样 的 事情 ， 也 就 是 在 
sipush 300 对 应 代码 中 把 变量 a、b、c 赋 值 
为 100、200、300。 这 4 条 指令 
i 的 图 示 略 过 

iload 1 

iload 2 

1sdd 

iload 3 

imul 


ireturr. 


8-6 ”执行 偏 移 地 址 为 1 的 指令 的 情况 


程序 计 改 器 执行 偏 移 地 址 为 11 的 指令 ， 
iload_1 指 令 的 作用 是 将 局 部 变 
bipush. 100 量 表 第 1 个 Slot 中 的 整 型 值 复制 
istore 1 到 操作 数 栈 顶 
sipush 200 
1store 2 
sipush 300 
10: istore 3 
11: ilosd 1 
iload2 
i1add 
iload 3 
imul 


ireturT. 


8-7 ”执行 偏 移 地 址 为 11 的 指令 的 情况 


程序 计数 器 执行 偏 移 地 址 为 12 的 指令 ， 
iload_2 指 令 的 执行 过 程 与 jload_l 
bipush 100 [12 | 是 类 似 ， 把 第 2 个 Slot 的 整 型 值 和 


Mehra 栈 。 画 出 这 个 指令 的 图 示 主 要 是 
sipush 200 为 了 显示 下 一 条 iadd 指 令 执 行 前 
istore_ 2 的 堆栈 状况 
sipush 300 

10: istore 3 

11: iload 1 

13: iadd 
iload 3 
Im 


ireturr. 


助 记 符 执行 偏 移 地 址 为 13 的 指令 ， 
iadd 指 令 的 作用 是 将 操作 数 栈 中 
bipush 100 头 两 个 栈 顶 元 素 出 栈 ， 做 整 型 加 
istore_l 法 ， 然 后 把 结果 重新 人 栈 。 在 
sipush 200 iadd 指 邻 执行 完 毕 后 ， 栈 中 原 有 
的 100 和 200 出 栈 ， 它 们 和 300 重 
新 入 栈 . 


istore 2 
sipush 300 
istore 3 
iload 1 
iload 2 
iadd 
iload 3 
imul 


ireturr. 


8-9 ”执行 偏 移 地 址 为 13 的 指令 的 情况 


助 记 符 
bipush 100 
istore_l 
sipush 200 
istore 2 
sipush 300 
istore 3 
iload 1 
iload 2 
1add 

15: imul 


16: ireturr. 


程序 计数 器 


执行 偏 移 地 址 为 14 的 指令 ， 

iload_3 指 令 把 存放 在 第 3 个 局 部 
变量 Slot 中 的 300 压 人 操作 数 栈 
中 。 这 时 操作 数 栈 为 两 个 整数 
300。 下 一 条 指令 imul 是 将 操作 
数 栈 中 头 两 个 栈 顶 元 素 出 栈 ， 做 
整 型 乘法 ， 然 后 把 结果 重新 人 
栈 ， 与 iadd 完 全 类 似 ， 所 以 笔者 
省 略图 示 -。 


图 8-10 执行 偏 移 地 址 为 14 的 指令 的 情况 


助 记 符 
bipush 100 
istore_l 
sipush 200 
istore 2 
sipush 300 
istore 3 
iload 1 
iload 2 
lisdd 
iload 3 


程 友 计数 器 


0 
1 
2 
3 


所 作 枝 


en, 


执行 偏 移 地 址 为 16 的 指 今 ， 
ireturn 指 令 是 方法 返回 指令 之 
， 它 将 结束 方法 执行 并 将 操作 
数 栈 项 的 整 型 值 返 回 给 此 方法 的 
调用 者 。 到 此 为 止 ， 这 段 方法 执 


行 结束 


图 8-11 执行 偏 移 地 址 为 16 的 指令 的 情况 


上 面 的 执行 过 程 仅 仅 是 一 种 概念 模型 ， 虚 拟 机 最 终 会 对 执行 过 程 
做 一 些 优 化 来 提高 性 能 ， 实 际 的 运作 过 程 不 一 定 完 全 符合 概念 模型 的 
描述 ..…... 更 准确 地 说 ， 实 际 情况 会 和 上 面 描述 的 概念 模型 差距 非常 
大 ， 这 种 差距 产生 的 原因 古 虚 拟 机 中 解析 如 和 即时 编译 右 剖 会 对 输入 
的 字 节 码 进 行 优化 ， 例 如 ， 在 HotSpot 虚 拟 机 中 ， 有 很 多 以 "fast_" 开 头 
的 非 标准 字 市 码 指 令 用 于 合并 、 准 换 输入 的 字 市 码 以 提升 解释 执行 性 
， 而 即时 编译 器 的 优化 手段 更 加 花样 繁多 品 。 


不 过 ， 我 们 从 这 段 程 序 的 执行 中 也 可 以 看 出 栈 结构 指令 集 的 一 般 
运行 过 程 ， 整 个 运算 过 程 的 中 间 变 量 都 以 操作 数 栈 的 出 栈 、 入 栈 为 信 
电 交 换 途 径 ， 符 合 我 们 在 前 面 分 析 的 特点 。 


[具体 可 以 参考 第 11 章 中 的 相关 内 容 。 


8.5 “本章 小 结 


本 章 中 ， 我 们 分 析 了 虚拟 机 在 执行 代码 时 ， 如 何 找到 正确 的 方 
法 、 如 何 执行 方法 内 的 字 市 码 ， 以 及 执行 代码 时 涉及 的 内 存 结构 。 在 
第 6、7、8 三 章 中 ， 我 们 针对 Java 程 序 是 如 何 存储 的 、 如 何 载 入 〈 创 
建 ) 的 ， 以 及 如 何 执行 的 问题 把 相关 知识 进行 了 讲解 ， 第 9 章 我 们 将 一 
起 看 看 这 些 理论 知识 在 具体 开发 之 中 的 经 典 应 用 。 


第 9 章 ”类 加 载 及 执行 子 系统 的 案例 与 实战 


代码 编译 的 结果 从 本 地 机 需 码 转变 为 字 世 码 ， 是 存储 格式 发 展 的 
一 小 步 ， 却 是 编程 语言 发 展 的 一 大 步 。 


9.1 概述 


在 Class 文 件 格式 与 执行 引擎 这 部 分 中 ， 用 户 的 程序 能 直接 影响 的 
内 容 并 不 太 多 ，Class 文 件 以 何 种 格式 存储 ， 类 型 何 时 加 载 、 如 何 连 
接 ， 以 及 虚拟 机 如 何 执行 字 世 码 指令 等 都 是 由 虚拟 机 直接 控制 的 行 
为 ， 用 户 程序 无 法 对 其 进行 改变 。 能 通过 程序 进行 操作 的 ， 主 要 是 字 
节 码 生成 与 类 加 载 右 这 两 部 分 的 功能 ， 但 仅 仪 在 如 何 处 理 这 两 点 上 ， 
谍 已 经 出 现 了 许多 值得 欣赏 和 借鉴 的 思路 ， 这 些 思 路 后 来 成 为 了 许多 
常用 功能 和 程序 实现 的 基础 。 在 本 划 中 ， 我 们 将 看 一 下 前 面 所 学 的 知 
识 在 实际 开发 之 中 是 如 何 应 用 的 。 


9.2 ”有 季 例 分 析 


在 案例 分 析 部 分 ， 笔 者 准备 了 4 个 例子 ， 关 于 类 加 载 融 和 子 市 码 的 
案例 各 有 两 个 。 并 且 这 两 个 领域 的 案例 中 各 有 一 个 案例 是 大 多 数 Java 
开发 人 员 都 使 用 过 的 工具 或 技术 ， 另 外 一 个 案例 虽然 不 一 定 每 个 人 都 
使 用 过 ， 但 却 特别 精彩 地 演绎 出 这 个 领域 中 的 技术 特性 。 斋 望 这 些 案 
例 能 引起 读者 的 思考 ， 并 给 读者 的 日 弟 工 作 市 来 灵感 。 


9.2.1 Tomcat: 正统 的 类 加 载 器 架构 


主流 的 Java Web 服 务 右 ， 如 Tomcat、Jetty、WebLogic、WebSphere 
或 其 他 笔者 没有 列举 的 服务 器 ， 都 实现 了 目 己 定 义 的 类 加 载 右 《一 般 
都 不 止 一 个 ) 。 因 为 一 个 功能 健全 的 web 服务 器 ， 要 解决 如 下 几 个 问 


题 : 


部 署 在 同一 个 服务 器 上 的 两 个 web 应 用 程序 所 使 用 的 Java 类 库 可 
以 实现 相互 隔离 。 这 是 最 基本 的 需求 ， 两 个 不 同 的 应 用 程序 可 能 会 依 
赖 同一 个 第 三 方 类 库 的 不 同 版 本 ， 不 能 要 求 一 个 类 库 在 一 个 服务 器 中 
只 有 一 份 ， 服 务 器 应 当 保 证 两 个 应 用 程序 的 类 库 可 以 互相 独立 使 用 。 


部 署 在 同一 个 服务 器 上 的 两 个 web 应 用 程序 所 使 用 的 Java 类 库 可 
以 互相 共 至 。 这 个 需求 也 很 常见 ， 例 如 ， 用 户 可 能 有 10 个 使 用 Spring 


组 织 的 应 用 程序 部 嗜 在 同一 台 服 务 器 上 ， 如 采 把 10 份 Spring 分 别 存 放 
在 各 个 应 用 程序 的 隔离 目录 中 ， 将 会 是 很 大 的 资源 浪费 一 一 这 主要 倒 
不 是 浪费 磁 副 空间 的 问题 ， 而 古 指 类 库 在 使 用 时 都 要 被 加 载 到 服务 右 
内 存 ， 如 果 类 库 不 能 共享 ， 虚 拟 机 的 方法 区 殊 会 很 容易 出 现 过 度 脱 胀 
的 风险 。 


服务 器 需要 尺 可 能 地 保证 目 映 的 安全 不 受 部 署 的 Web 应 用 程序 影 
啊 。 目 前 ， 有 许多 主流 的 Java Web 服 务 器 自身 也 是 使 用 Java 语 言 来 实 
现 的 。 因 此 ， 服 务 器 本 映 也 有 类 库 依赖 的 问题 ， 一 般 来 襄 ， 基 于 安全 
考虑 ， 服 务 器 所 使 用 的 类 库 应 该 与 应 用 程序 的 类 库 互 相 独 立 。 


文 持 JSP 应 用 的 Web 服 务 右 ， 大 多 数 都 需要 文 持 HotSwap 功 能 。 我 
们 知道 ，JSP 文 件 最 终 要 编译 成 Java Class 才 能 由 虚拟 机 执行 ， 但 JSP 文 
件 由 于 其 纯 文 本 存储 的 特性 ， 运 行 时 修改 的 概率 远 远大 于 第 三 方 类 库 
或 程序 自身 的 Class 文 件 。 而 且 ASP、PHP 和 JSP 这 些 网 页 应 用 也 把 修改 
后 无 须 重 局 作为 一 个 很 大 的 "优势 "来 看 待 ， 因 此 “主流 ”的 Web 服 务 器 
都 会 文 持 JSP 生 成 类 的 热 替 换 ， 当 然 也 有 * 非 主流 ”的 ， 如 运行 在 生产 模 
式 (Production Mode) 下 的 WebLogic 服 务 器 默认 就 不 会 处 理 JSP 文 件 
的 变化 。 


由 于 存在 上 述 问题 ， 在 部 署 Web 应 用 时 ， 单 独 的 一 个 ClassPath 刺 
无 法 满足 需求 了 ， 所 以 各 种 Web 服 务 右 都 “不 约 而 同 ” 地 提供 了 好 几 个 
ClassPath 路 径 供用 户 存放 第 三 方 类 库 ， 这 些 路 径 一 般 都 


以 "lib" 或 "classes" 命 名 。 被 放置 到 不 同 路 径 中 的 类 库 ， 具 备 不 同 的 访问 
范围 和 服务 对 象 ， 通 常 ， 每 一 个 目录 都 会 有 一 个 相应 的 目 定义 类 加 载 
器 去 加 载 放 置 在 里 面 的 Java 类 库 。 现 在 ， 笔 者 就 以 Tomcat 服 务 器 中 为 
例 ， 看 一 看 Tomcat 具 体 是 如 何 规划 用 户 类 库 结构 和 类 加 载 器 的 。 


在 Tomcat 目 录 结 构 中 ， 有 3 组 目录 
(Wcommon/*"、"/server/*" 和 "/shared/*") 可 以 存放 Java 类 库 ， 另 外 还 
可 以 加 上 Web 应 用 程序 自身 的 目录 "/WEB-INF/*"， 一 共 4 组 ， 把 Java 类 

库 放 置 在 这 些 目 录 中 的 含义 分 别 如 下 。 


放置 在 /common 目 杂 中 : 类 库 可 被 Tomcat 和 所 有 的 Web 应 用 程序 
共同 使 用 。 


放置 在 /server 目 了 未 中 : 类 库 可 被 Tomcat 使 用 ， 对 所 有 的 Web 应 用 程 
序 都 不 可 见 。 


放置 在 /shared 目 录 中 : 类 库 可 被 所 有 的 Web 应 用 程序 共同 使 用 ， 
但 对 Tomcat 目 己 不 可 见 。 


放置 在 /WebApp/WEB-INF 目 好 中 : 类 库 仅 仅 可 以 被 此 Web 应 用 程 
序 使 用 ， 对 Tomcat 和 其 他 Web 应 用 程序 都 不 可 见 。 


为 了 文 持 这 套 目 隶 结构 ， 并 对 目录 里 面 的 类 库 进行 加 载 和 隔离 ， 
Tomcat 目 定义 了 多 个 类 加 载 器 ， 这 些 类 加 载 絮 按照 经 典 的 双亲 委派 模 


型 来 实现 ， 其 天 系 如 图 9-1 所 示 。 


Common 类 加 载 器 
CommonClassLoader 


A AS 


Catalina 类 加 载 器 Shared 类 加 载 器 
CatalinaClassLoader SharedClassLoader 


9-1 Tomcat 服 务 名 的 类 加 载 染 构 


灰色 育 景 的 3 个 类 加 载 釉 是 JDK 默 认 捉 供 的 类 加 载 碍 ， 这 3 个 加 载 
名 的 作用 在 第 7 章 中 已 经 介绍 过 了 。 而 CommonClassLoader、 
CatalinaClassLoader 、SharedClassLoader 和 WebappClassLoader 则 是 
Tomcat 目 己 定义 的 类 加 载 器 ， 它 们 分 别 加 
载 /common/*、/server/*、/shared/* 和 /WebApp/WEB-INF/* 中 的 Java 类 
库 。 其 中 WebApp 类 加 载 器 和 Jsp 类 加 载 器 通常 会 存在 多 个 实例 ， 每 一 
个 Web 应 用 程序 对 应 一 个 WebApp 类 加 载 娟 ， 每 一 个 JSP 文 件 对 应 一 个 
Jsp 类 加 载 右 。 


从 图 9-1 的 委派 关系 中 可 以 看 出 ，CommonClassLoader 能 加 载 的 类 
都 可 以 被 Catalina ClassLoader 和 SharedClassLoader 使 用 ， 而 
CatalinaClassLoader 和 SharedClassLoader 自 己 能 加 载 的 类 则 与 对 方 相互 
隔离 。WebAppClassLoader 可 以 使 用 SharedClassLoader 加 载 到 的 类 ， 但 
各 个 WebAppClassLoader 实 例 之 间 相 互 隔离 。 而 JasperLoader 的 加 载 苑 
围 仅 仅 是 这 个 JSP 文 件 所 编译 出 来 的 那 一 个 Class， 它 出 现 的 目的 就 是 
为 了 被 丢弃 : 当 服 务 器 检测 到 JSP 文 件 被 修改 时 ， 会 蔡 换 掉 目 前 的 
JasperLoader 的 实例 ， 并 通过 再 建立 一 个 新 的 Jsp 类 加 载 器 来 实现 JSP 文 
件 的 HotSwap 功 能 。 


对 于 Tomcat 的 6.x 版 本 ， 只 有 指定 了 tomcat/conf/catalina.properties 
配置 文件 的 server.loader 和 share.loader 项 后 才 会 真正 建立 


CatalinaClassLoader 和 SharedClassLoader 的 实例 ， 否 则 会 用 到 这 两 个 类 


加 载 器 的 地 方 都 会 用 CommonClassLoader 的 实例 代替 ， 而 默认 的 配置 
文件 中 没有 设置 这 两 个 loader 项 ， 所 以 Tomcat 6.x 顺 理 成 章 地 

把 /common、/server 和 /shared 三 个 目录 默认 合并 到 一 起 变 成 一 个 /lib 目 
录 ， 这 个 目录 里 的 类 库 相 当 于 以 前 /common 目 录 中 类 库 的 作用 。 这 是 
Tomcat 设 计 团 队 为 了 简化 大 多 数 的 部 署 场景 所 做 的 一 项 改进 ， 如 果 默 
认 设 置 不 能 满足 需要 ， 用 户 可 以 通过 修改 配置 文件 指定 serverloader 和 
share.loader 的 方式 重新 启用 Tomcat 5.x 的 加 载 器 架构 。 


Tomcat 加 载 絮 的 实现 清晰 易 届 ， 并 且 采 用 了 官方 推荐 的 “正统 ”的 
使 用 类 加 载 磺 的 方式 。 如 采 读 者 阅读 完 上 面 的 案例 后 ， 能 完全 理解 
Tomcat 设 计 团队 这 样 布置 加 载 器 架构 的 用 意 ， 那 说 明 已 经 大 致 掌握 了 
类 加 载 器 “主流 ”的 使 用 方式 ， 那 么 笔者 不 妨 再 提 一 个 问题 让 读者 思考 
一 下 : 前 面 曾 经 提 到 过 一 个 场景 ， 如 果 有 10 个 Web 应 用 程序 都 是 用 
Spring 来 进行 组 织 和 管理 的 话 ， 可 以 把 Spring 放 到 Common 或 Shared 目 
录 下 让 这 些 程序 共享 。Spring 要 对 用 户 程 序 的 类 进行 管理 ， 上 自然 要 能 
访问 到 用 户 程序 的 类 ， 而 用 户 的 程序 显然 是 放 在 /WebApp/WEB-INF 目 
录 中 的 ， 那 么 被 CommonClassLoader 或 SharedClassLoader 加 载 的 Spring 
如 何 访问 并 不 在 其 加 载 范围 内 的 用 户 程 序 呢 ? 如 果 读 过 本 书 第 7 草 的 相 
天 内容 ， 相 信 读 者 可 以 很 容易 地 回答 这 个 问题 。 


[Tomcat 是 Apache 基 金 会 中 的 一 款 开 源 的 Java Web 服 务 嚣 ， 主 页 地 址 


为 : http://tomcat.apache.org。 本 案例 中 选用 的 是 Tomcat 5.x 服 务 器 的 目 


示 和 类 加 载 器 结构 ， 在 Tomcat 6.x 的 默认 配置 下 ，/common 、/server 
和 /shared 三 个 目 孙 已 经 合并 到 一 起 了 。 


9.2.2 OSGi: 灵活 的 类 加 载 器 架构 


Java 程 序 社区 中 流传 着 这 么 一 个 观点 : “学 习 JEE 规 范 ， 去 看 JBoss 
源码 ， 学 习 类 加 载 器 ， 就 去 看 OSGi 源 码 *”。 尺 管 JEE 规 范 " 和 “类 加 载 
器 的 知识 ”并 不 是 一 个 对 等 的 概念 ， 不 过 ， 有 既然 这 个 观点 能 在 程序 员 中 
流传 开 来 ， 也 从 侧面 说 明了 OSGi 对 类 加 载 器 的 运用 确实 有 其 独到 之 
处 。 


OSGil (Open Service Gateway Initiative) 是 OSGi 联 盟 (OSGi 
Alliance) 制定 的 一 个 基于 Java 语 言 的 动态 模块 化 规范 ， 这 个 规范 最 初 
由 Sun、IBM、 爱 立信 等 公司 联合 发 起 ， 目 的 是 使 服务 提供 商 通过 住宅 
网 关 为 各 种 家 用 智能 设备 提供 各 种 服务 ， 后 来 这 个 规范 在 Java 的 其 他 
技术 领域 也 有 相当 不 错 的 发 展 ， 现 在 已 经 成 为 Java 世 界 中 “事实 上 ”的 
模块 化 标准 ， 并 且 已 经 有 了 Equinox、Felix 等 成 熟 的 实现 。OSGi 在 Java 
程序 员 中 最 著名 的 应 用 案例 就 是 Eclipse IDE， 另 外 还 有 许多 大 型 的 软 
件 平台 和 中 间 件 服务 如 都 基于 或 声明 将 会 基于 OSGi 规 范 来 实现 ， 如 
IBM Jazz 平 台 、GlassFish 服 务 器 、jBoss OSGi 等 。 


OSGi 中 的 每 个 模块 ( 称 为 Bundle) 与 普通 的 Java 类 库 区 别 并 不 太 
大 ， 两 者 一 般 都 以 JAR 格 式 进 行 封 狼 ， 并 且 内 部 存储 的 都 是 Java 
Package 和 Class。 但 是 一 个 Bundle 可 以 声明 它 所 依赖 的 Java Package 


(通过 Import-Package 描 述 ) ， 也 可 以 声明 它 允 许 导出 发 布 的 Java 
Package (通过 Export-Package 描 述 ) 。 在 OSGi 里 面 ，Bundle 之 间 的 依 
赖 关 系 从 传统 的 上 层 模块 依赖 底层 模块 转变 为 平 级 模块 之 间 的 依赖 
(至 少 外 观 上 如 此 ) ， 而 且 类 库 的 可 见 性 能 得 到 非常 精确 的 控制 ， 一 
个 模块 里 只 有 被 Export 过 的 Package 才 可 能 由 外 界 访问 ， 其 他 的 Package 
和 Class 将 会 隐藏 起 来 。 除 了 更 精确 的 模块 划分 和 可 见 性 控制 外 ， 引 入 
OSGi 的 另外 一 个 重要 理由 是 ， 基 于 OSGi 的 程序 很 可 能 (只 是 很 可 
能 ， 并 不 是 一 定 会 ) 可 以 实现 模块 级 的 热 播 拔 功能 ， 当 程序 升级 更 新 
或 调试 除 错 时 ， 可 以 只 停 用 、 重 新 安装 然后 启用 程序 的 其 中 一 部 分 ， 
这 对 企业 级 程序 开发 来 说 是 一 个 非常 有 诱惑 力 的 特性 。 


OSGi 之 所 以 能 有 上 述 “ 诱 人 ”的 特点 ， 要 归功 于 它 灵活 的 类 加 载 器 
架构 。0SGi 的 Bundle 类 加 载 器 之 间 只 有 规则 ， 没 有 固定 的 委派 关系 。 
例如 ， 某 个 Bundle 声 明了 一 个 它 依赖 的 Package， 如 果 有 其 他 Bundle 声 
明 发 布 了 这 个 Package， 那 么 所 有 对 这 个 Package 的 类 加 载 动作 都 会 委 
派 给 发 布 它 的 Bundle 类 加 载 器 去 完成 。 不 涉及 某 个 具体 的 Package 时 ， 
各 个 Bundle 加 载 器 都 是 平 级 关系 ， 只 有 具体 使 用 某 个 Package 和 Class 的 
时 候 ， 才 会 根据 Package 导 入 导出 定义 来 构造 Bundle 间 的 委派 和 依赖 。 


另外 ， 一 个 Bundle 类 加 载 右 为 其 他 Bundle 提 供 服 务 时 ， 会 根据 
Export-Package 列 表 严 格 控制 访问 范围 。 如 果 一 个 类 存在 于 Bundle 的 类 
库 中 但 是 没有 被 Export， 那 么 这 个 Bundle 的 类 加 载 絮 能 找到 这 个 类 ， 


但 不 会 提供 给 其 他 Bundle 使 用 ， 而 且 OSGi 平 台 也 不 会 把 其 他 Bundle 的 
类 加 载 请 求 分 配给 这 个 Bundle 来 处 理 。 


我 们 可 以 举 一 个 更 具体 一 些 的 简单 例子 ,假设 存在 Bundle A、 
Bundle B、Bundle C 三 个 模块 ， 并 且 这 三 个 Bundle 定 义 的 依赖 关系 如 


Bundle A: 声明 发 布 『packageA， 依 赖 了 java.* 的 包 。 


Bundle B: 声明 依赖 了 packageA 和 packageC， 同 时 也 依赖 了 java.* 
的 包 。 


Bundle C: 声明 发 布 了 packageC， 依 赖 了 packageA 。 


那么 ， 这 三 个 Bundle 之 间 的 类 加 载 器 及 父 类 加 载 器 之 间 的 关系 如 
图 9-2 所 示 。 


9-2 0OSGi 的 类 加 载 器 架构 


由 于 没有 牵扯 到 具体 的 OSGi 实 现 ， 所 以 图 9-2 中 的 类 加 载 器 都 没 
有 指明 具体 的 加 载 右 实现 ， 只 是 一 个 体现 了 加 载 釉 之 间 关 系 的 概念 模 
型 ， 并 且 只 是 体现 了 OSGi 中 最 简单 的 加 载 器 委派 关系 。 一 般 来 说 ， 在 
OSGi 中 ， 加 载 一 个 类 可 能 发 生 的 查找 行为 和 委派 关系 会 比 图 9-2 中 显 
示 的 复杂 得 多 ， 类 加 载 时 可 能 进行 的 查找 规则 如 下 : 


以 java.* 开 头 的 类 ， 委 派 给 父 类 加 载 右 加 载 。 
人 否则， 委派 列表 名 单 内 的 类 ， 委 派 给 父 类 加 载 右 加 载 。 


否则 ，Import 列 表 中 的 类 ， 委 派 给 Export 这 个 类 的 Bundle 的 类 加 载 
厂 加 载 。 


否则 ， 和 查找 当前 Bundle 的 Classpath， 使 用 目 己 的 类 加 载 右 加 载 。 


否则 ， 查 找 是 否 在 自己 的 Fragment Bundle 中 ， 如 果 是 ， 则 委派 给 


Fragment Bundle 的 类 加 载 右 加 载 。 


否则 ， 查 找 Dynamic Import 列 表 的 Bundle， 委 派 给 对 应 Bundle 的 类 
加 载 右 加 载 。 


舍 则 ， 类 查找 失败 。 


从 图 9-2 中 还 可 以 看 出 ， 在 OSGi 里 面 ， 加 载 器 之 间 的 关系 不 再 是 
双亲 委派 模型 的 树 形 结构 ， 而 是 已 经 进一步 发 展 成 了 一 种 更 为 复杂 
的 、 运 行 时 才能 确定 的 网 状 结构 。 这 种 网 状 的 类 加 载 器 架构 在 禹 来 更 
好 的 灵活 性 的 同时 ， 也 可 能 会 产生 许多 新 的 隐患 。 笔 者 曾经 参与 过 将 
一 个 非 OSGi 的 大 型 系统 向 Equinox OSGi 平 台 迁 移 的 项 目 ， 由 于 历史 原 
因 ， 代 码 模块 之 间 的 依赖 关系 错综复杂 ， 秽 强 分 离 出 各 个 模块 的 
Bundle 后 ， 发 现在 高 并 发 环境 下 经 常 出 现 死 锁 。 我 们 很 容易 就 找到 了 
死 锁 的 原因 : 如 果 出 现 了 Bundle A 依 赖 Bundle B 的 Package B， 而 
Bundle B 又 依赖 了 Bundle A 的 Package A， 这 两 个 Bundle 进 行 类 加 载 时 
就 很 容易 发 生死 锁 。 具 体 情 况 是 当 Bundle A 加 载 Package B 的 类 时 ， 首 
先 需要 锁定 当前 类 加 载 器 的 实例 对 象 

(java.lang.ClassLoader.loadClass() 是 一 个 synchronized 方 法 ) ， 然 后 把 
请 求 委 派 给 Bundle B 的 加 载 器 处 理 ， 但 如 有 果 这 时 候 Bundle B 也 正好 想 


加 载 Package A 的 类 ， 它 也 先 锁定 自己 的 加 载 器 再 去 请 求 Bundle A 的 加 
载 嚣 处理， 这 样 ， 两 个 加 载 器 都 在 等 待 对方 处 理 自己 的 请 求 ， 而 对 方 
处 理 完 之 前 自己 又 一 直 处 于 同步 锁定 的 状态 ， 因 此 它们 就 互相 死 锁 ， 
永远 无 法 完成 加 载 请 求 了 。Equinox 的 Bug List 中 有 关于 这 类 问题 的 
Bugl， 也 提供 了 一 个 以 牺牲 性 能 为 代价 的 解决 方案 一 一 用 户 可 以 启 
用 osgi.classloader.singleThreadLoads 参 数 来 按 单线 程 串 行 化 的 方式 强制 
进行 类 加 载 动 作 。 在 JDK 1.7 中 ， 为 非 树 状 继承 关系 下 的 类 加 载 器 架构 
进行 了 一 次 专门 的 升级 中， 目的 是 从 底层 避免 这 类 死 锁 出 现 的 可 能 。 


总 体 来 说 ，OSGi 描 绘 了 一 个 很 美好 的 模块 化 开发 的 目标 ， 而 且 定 
义 了 实现 这 个 目标 所 需要 的 各 种 服务 ， 同 时 也 有 成 熟 框 架 对 其 提供 实 
现 支 持 。 对 于 单个 虚拟 机 下 的 应 用 ， 从 开发 初期 束 建 立 在 OSGi 上 是 一 
个 很 不 错 的 选择 ， 这 样 便于 约束 依赖 。 但 并 非 所 有 的 应 用 都 适合 采用 
0OSGi 作 为 基础 架构 ，OSGi 在 提供 强大 功能 的 同时 ， 也 引入 了 额外 的 
复杂 度 ， 融 来 了 线程 死 锁 和 内 存 泄漏 的 风险 。 


[1]OSGi 官 方 站 点 : http:/www.osgi.org/Main/HomePage 。 
[21]Bug-121737: https://bugs.eclipse.org/bugs/show_bug.cgi?id=121737。 
[3]JDK 1.7-Upgrade class-loader architecture 


http://openjdk.java.net/projects/jdk7/features/#{352 ° 


9.2.3 字 节 码 生 成 技术 与 动态 代理 的 实现 


“ 字 节 码 生 成 * 并 不 是 什么 高 深 的 技术 ， 读 者 在 看 到 “ 字 节 码 生 
成 ”这 个 标题 时 也 先 不 必 去 想 诸 如 Javassist、CGLib、ASM 之 类 的 字 节 
码 类 库 ， 因 为 JDK 里 面 的 javac 命 令 就 是 字 节 码 生 成 技术 的 “ 老 祖 宗 ”， 
并 且 javac 也 是 一 个 由 Java 语 言 写 成 的 程序 ， 它 的 代码 存放 在 OpenJDK 
的 langtools/src/share/classes/com/sun/tools/javac 目 录 中 帆 。 要 深入 了 解 
字 节 码 生 成 ， 阅 读 javac 的 源码 是 个 很 好 的 途径 ， 不 过 javac 对 于 我 们 这 
个 例子 来 说 太 过 庞大 了 。 在 Java 里 面 除了 javac 和 和 字 节 码 类 库 外 ， 使 用 
字 节 人 码 生 成 的 例子 还 有 很 多 ， 如 Web 服 务 器 中 的 JSP 编 译 器 ， 编 译 时 植 
入 的 AOP 框 架 ， 还 有 很 常用 的 动态 代理 技术 ， 甚 至 在 使 用 反射 的 时 候 
虚拟 机 都 有 可 能 会 在 运行 时 生成 字 节 码 来 提高 执行 速度 。 我 们 选择 其 
中 相对 简单 的 动态 代理 来 看 看 字 节 码 生 成 技术 是 如 何 影响 程序 运作 
的 。 


相信 许多 Java 开 发 人 员 都 使 用 过 动态 代理 ， 即 使 没有 直接 使 用 过 
java.lang.reflect.Proxy 或 实现 过 java.lang.reflect.InvocationHandler 接 口 ， 
应 该 也 用 过 Spring 来 做 过 Bean 的 组 织 管理 。 如 有 果 使 用 过 Spring， 那 大 多 
数 情况 都 会 用 过 动态 代理 ， 因 为 如 条 Bean 征 面 癌 接口 编程 ， 那 么 在 
Spring 内 部 都 是 通过 动态 代理 的 方式 来 对 Bean 进 行 增强 的 。 动 态 代理 
中 所 谓 的 “动态 "， 是 针对 使 用 Java 代 码 实 际 编写 了 代理 类 的 “静态 ” 代 


理 而 言 的 ， 它 的 优势 不 在 于 省 去 了 编写 代理 类 那 一 点 工作 量 ， 而 是 实 
现 了 可 以 在 原始 类 和 接口 还 未 知 的 时 候 ， 束 确定 代理 类 的 代理 行为 ， 
当代 理 类 与 原始 类 脱离 直接 联系 后 ， 束 可 以 很 灵活 地 重用 于 不 同 的 应 
用 场景 之 中 。 


代码 清单 9-1 演 示 了 一 个 最 简单 的 动态 代理 的 用 法 ， 原 始 的 逻辑 是 
打印 一 句 "hello world"， 代 理 类 的 逻辑 是 在 原始 类 方法 执行 前 打印 一 
句 "welcome"。 我 们 先 看 一 下 代码 ， 然 后 再 分 析 JDK 是 如 何 做 到 的 。 


代码 清单 9-1 动态 代理 的 简单 示例 


public class DynamicProxyTestt{ 
interface IHellof{ 
void sayHello(); 


static class Hello implements IHellof{ 

Q@Override 

public void sayHello(){ 

System.out.println ("hello world") ; 

} 

} 

static class DynamicProxy implements InvocationHandler{ 

Object original0bj ; 

Object bind (Object originalobj) { 

this,.originalobj=originalobj ; 

return 

Proxy .newProxyInstance (originalobj.getClass().getclassLoader(), 
originalobj.getClass().getInterfaces()，this) 

} 

Q@Override 

public Object invoke (Object proxy,Method method,0bject[]args) 
throws Throwablef{ 

System.out.println ("welcome") ; 

return method.invoke (originalobj,args) ; 

} 

} 


public static void main (String[]args) { 


IHello hello= (IHello) new DynamicProxy().bind (new Hello()) ; 
hello.sayHello( ); 

} 

} 


运行 结 采 如 下 : 


welcome 
hello world 


上 述 代码 里 ， 唯 一 的 “黑匣子 ”就 是 Proxy.newProxyInstance() 方 法 ， 
除 此 之 外 再 没有 任何 特殊 之 处 。 这 个 方法 返回 一 个 实现 了 IHello 的 接 
口 ， 并 且 代 理 了 new Hello0 实 例 行 为 的 对 象 。 跟 踩 这 个 方法 的 源码 ， 
可 以 看 到 程序 进行 了 验证 、 优 化 、 缓 存 、 同 步 、 生 成 字 节 码 、 显 式 类 
加 载 等 操作 ， 前 面 的 步骤 并 不 是 我 们 关注 的 重点 ， 而 最 后 它 调 用 了 
sun.misc.ProxyGenerator.generateProxyClass() 方 法 来 完成 生成 字 节 码 的 
动作 ， 这 个 方法 可 以 在 运行 时 产生 一 个 描述 代理 类 的 字 节 码 byte[] 数 
组 。 如 果 想 看 一 看 这 个 在 运行 时 产生 的 代理 类 中 写 了 些 什 么 ， 可 以 在 
main() 方 法 中 加 入 下 面 这 人 句 : 


System,getProperties().put 
("sun.misc.ProxyGenerator.saveGeneratedFiles", "true") ; 


加 入 这 人 句 代 码 后 再 次 运行 程序 ， 磁 一 中 将 会 产生 一 个 名 
为 "9Proxy0.class" 的 代理 类 Class 文 件 ， 反 编译 后 可 以 看 见 如 代码 清单 9- 
2 所 示 的 内 容 。 


代码 清单 9-2” 反 编译 的 动态 代理 类 的 代码 


package org.fenixsoft.bytecode.; 

import java.lang.reflect.InvocationHandler.; 

import java.lang.reflect.Method.; 

import java.lang.reflect.Proxy:; 

import java.lang.reflect.UndeclaredThrowableException; 
public final class $Proxy0 extends Proxy 

implements DynamicProxyTest.IHello 

{ 

private static Method m3; 

private static Method mi; 

private static Method mo; 

private static Method m2; 

public $Proxy9 (InvocationHandler paramInvocationHandler) 
throws 


{ 


super (paramInvocationHandler) ; 


public final void sayHello() 
throws 

{ 

try 

{ 

this.h.invoke (this,m3, null) ; 
returni 

} 

catch (RuntimeException localRuntimeException) 
{ 

throw localRuntimeException.; 

} 

catch (Throwable localThrowable) 
{ 


throw new UndeclaredThrowableException (localThrowable) ; 


} 


} 
// 此 处 由 于 版 面 原因 ， 省 略 edquals()、hashcode()、toString() 三 个 方法 的 代码 
// 这 3 个 方法 的 内 容 与 sayHello( ) 非 常 相似 。 


static 


try 


m3=Class.forName ("org.fenixsoft.bytecode.DynamicproxyTest 
$IHello") .getMethod ("sayHello", new Class[0]) : 


m1i=Class.forName ("java.lLlang,.0bject") .getMethod ("equals", new 
class[]{Class.forName ("java.lang.0bject") +) ; 

mo=Class.forName ("java.lang.0bject") .getMethod ("hashCcode", new 
class[0]) ; 

m2=Class.forName ("java.lang.Object") .getMethod ("toString", new 
class[0]) ; 

return; 

catch (NoSuchMethodException localNoSuchMethodException) 


throw new NoSuchMethodError 
(localNoSuchMethodException.getMessage()) ; 


catch (ClassNotFoundException localclassNotFoundException) 


throw new NoClassDefFoundError 
(localClassNotFoundException.getMessage()) ; 


} 
} 
这 个 代理 类 的 实现 代码 也 很 简单 ， 它 为 传 入 接口 中 的 每 一 个 方 

法 ， 以 及 从 java.lang.Object 中 继承 来 的 equals()、hashCode()、toString() 
方法 都 生成 了 对 应 的 实现 ， 并 且 统一 调用 了 InvocationHandler 对 象 的 
invoke() 方 法 〈 代 码 中 的 "this.h" 就 是 父 类 Proxy 中 保存 的 
InvocationHandler 实 例 变 量 ) 来 实现 这 些 方法 的 内 容 ， 各 个 方法 的 区 别 
不 过 是 传 入 的 参数 和 Method 对 象 有 所 不 同 而 已 ， 所 以 无 论调 用 动态 代 
理 的 哪 一 个 方法 ， 实 际 上 都 是 在 执行 InvocationHandlerinvokeO 中 的 代 
理 逻 辑 。 


这 个 例子 中 并 没有 讲 到 generateProxyClass(0) 方 法 具体 是 如 何 产生 
代理 类 '"$Proxy0.class" 的 字 布 码 的 ， 大 致 的 生成 过 程 其 实 束 是 根据 
Class 文 件 的 格式 规范 去 拼装 字 届 码 ， 但 在 实际 开发 中 ， 以 byte 为 单位 


直接 拼装 出 字 节 码 的 应 用 场合 很 少见 ， 这 种 生成 方式 也 只 能 产生 一 些 
高 度 模板 化 的 代码 。 对 于 用 户 的 程序 代码 来 说 ， 如 果 有 要 大 量 操作 字 
节 码 的 需求 ， 还 是 使 用 封闭 好 的 字 节 但 类 库 比 较 合 适 。 如 采 读 者 对 动 
态 代 理 的 字 节 人 码 拼 闭 过 程 很 感 兴趣 ， 可 以 在 OpenJDK 的 
jdk/src/share/classes/sun/misc 目 录 下 找到 sun.misc.ProxyGenerator 的 源 
码 。 


[如 何 获取 OpenJDK 源 码 ， 请 参见 本 书 第 1 章 的 相关 内 容 。 


9.2.4 Retrotranslator: 跨越 JDK 版 本 


一 般 来 说 ， 以 “做 项 目 ” 为 主 的 软件 公司 比较 容易 更 新 技术 ， 在 下 
一 个 项 目 中 换 一 个 技术 框架 、 升 级 到 最 新 的 JDK 版 本 ， 其 至 把 Java 换 成 
C#、C++ 来 开发 程序 都 是 有 可 能 的 。 但 当 公司 发 展 壮 大 ， 技 术 有 所 积 
索 ， 逐 渐 成 为 以 “做 产品 ”为 主 的 软件 公司 后 ， 目 主 选 择 技 术 的 权利 就 
会 炎 失 挥 ， 因 为 之 前 所 积 系 的 代码 和 技术 都 是 用 真 金 日 银 换 来 的 ， 一 
个 稳健 的 团队 也 不 会 随意 地 改变 底层 的 技术 。 然 而 在 飞速 发 展 的 程序 
设计 领域 ,新 技术 总 是 日 新 月 异 、 层 出 不 穷 ， 偏 偏 这 些 新 技术 义 如 鲜 
化 之 于 蜜蜂 一 样 ， 对 程序 员 散 发 着 天 然 的 吸引 力 。 


在 Java 世 界 里 ， 每 一 次 JDK 大 版 本 的 发 布 ， 都 伴随 着 一 场 大 规模 的 

技术 革新 ， 而 对 Java 程 序 编写 习惯 改变 最 大 的 ， 无 疑 是 JDK 1.5 的 发 
布 。 自 动 装 箱 、 沁 型 、 动 态 注解 、 枚 举 、 变 长 参数 、 遍 历 循 环 

(foreach 循 环 ) .………. 事实 上 ， 在 没有 这 些 语法 特性 的 年 代 ，Java 程 序 也 
照样 能 写 ， 但 是 现在 看 来 ， 上 述 每 一 种 语法 的 改进 儿 乎 都 是 “ 必 不 可 
少 ” 的 。 束 如同 习惯 了 24 寸 液晶 显示 避 的 程序 员 ， 很 难 习惯 在 15 寸 纯 平 
显示 器 上 编写 代码 。 但 假如 “不 洱 ” 因 为 要 保护 现 有 投资 、 维 持 程 序 结 
构 稳 定 等 ， 必 须 使 用 1.5 以 前 版 本 的 JDK 呢 ? 我 们 没有 办 法 把 15 寸 显示 
器 变 成 24 寸 的 ， 但 却 可 以 跨越 JDK 版 本 之 间 的 沟 蜜 ， 把 JDK 1.5 中 编写 
的 代码 放 到 JDK 1.4 或 1.3 的 环境 中 去 部 署 使 用 。 为 了 解决 这 个 问题 ， 一 


种 名 为 "Java 逆 辐 移植 > 的 工具 (Java Backporting Tools) 应 运 而 生 ， 
Retrotranslatorl!| 是 这 类 工具 中 较 出 色 的 一 个 。 


Retrotranslator 的 作用 是 将 JDK 1.5 编 译 出 来 的 Class 文 件 转 变 为 可 以 
在 JDK 1.4 或 1.3 上 部 署 的 版 本 ， 它 可 以 很 好 地 文 持 目 动 痛 箱 、 泛 型 、 动 
态 注 解 、 枚 举 、 变 长 参数 、 人 遍历 循环 、 静 态 导 入 这 些 语法 特性 ， 甚 至 
还 可 以 支持 JDK 1.5 中 新 增 的 集合 改进 、 并 发 包 以 及 对 泛 型 、 注 解 等 的 
反射 操作 。 了 解 了 Retrotranslator 这 种 迹 问 移植 工具 可 以 做 什么 以 后 ， 
现在 关心 的 是 它 是 怎样 做 到 的 ? 


要 想 知 道 Retrotranslator 如 何在 旧版 本 JDK 中 模拟 新 版 本 JDK 的 功 
能 ， 首 先 要 和 弄 清 楚 ]JDK 升 级 中 会 提供 哪些 新 的 功能 。JDK 每 次 升级 新 增 
的 功能 大 致 可 以 分 为 以 下 4 类 : 


在 编译 万 层 面 做 的 改进 。 如 目 动 玫 箱 拆 箱 ， 实 际 上 吏 是 编译 右 在 
程序 中 使 用 到 包装 对 象 的 地 方 自动 插入 了 很 多 IntegervalueOfO、 
Float.valueOf0) 之 类 的 代码 ， 变 长 参数 在 编译 之 后 束 目 动 转化 成 了 一 个 
数组 来 完成 参数 传递 ， 沁 型 的 信息 则 在 编译 阶段 就 已 经 擦 除 控 了 (但 
是 在 元 数据 中 还 保留 着 ) ， 相 应 的 地 方 被 编译 器 自动 插入 了 类 型 转换 
代码 (1 。 


对 Java API 的 代码 增强 。 壁 如 JDK 1.2 时 代 引 入 的 
java.util.Collections 等 一 系列 集合 类 ， 在 JDK 1.5 时 代 引 入 的 


java.util.concurrent 并 发 包 等 。 


需要 在 字 节 码 中 进行 支持 的 改动 。 如 JDK 1.7 里 面 新 加 入 的 语法 特 
性 :动态 语言 支持 ， 就 需要 在 虚拟 机 中 新 增 一 条 invokedynamic 字 节 码 
指令 来 实现 相关 的 调用 功能 。 不 过 字 市 码 指 令 集 一 直 处 于 相对 比较 稳 
定 的 状态 ， 这 种 需要 在 字 节 码 层 面 直接 进行 的 改动 是 比较 少见 的 。 


虚拟 机 内 部 的 改进 。 如 JDK 1.5 中 实现 的 JSR-133053 规范 重新 定义 的 
Java 内 存 模 型 (Java Memory Model,JMM) 、CMS 收 集 器 之 类 的 改动 ， 
这 类 改动 对 于 程序 员 编写 代码 基本 是 透明 的 ， 但 会 对 程序 运行 时 产生 


影响 。 


上 述 4 类 新 功能 中 ，Retrotranslator 只 能 模拟 前 两 类 ， 对 于 后 面 两 类 
直接 在 虚拟 机 内 部 实现 的 改进 ， 一 般 所 有 的 逆向 移植 工具 都 是 无 能 大 
力 的 ， 至 少 不 能 完整 地 或 者 在 可 接受 的 效率 上 完成 全 部 模拟 ， 否 则 虚 
拟 机 设计 团队 也 没有 必要 售 近 求 远 地 改 动 处 于 JDK 底 层 的 虚拟 机 。 在 可 
以 模拟 的 两 类 功能 中 ， 第 二 类 模拟 相对 更 容易 实现 一 些 ， 如 JDK 1.53 
入 的 java.util.concurrent 包 ， 实 际 是 由 多 线程 大 师 Doug Lea 开 发 的 一 套 并 
发 包 ， 在 JDK 1.5 出 现 之 前 就 已 经 存在 〈 那 时 候 名 字 叫 做 
di.util.concurrent，3 引 入 JDK 时 由 作者 和 JDK 开 发 团队 共同 做 了 一 些 改 
进 ) ， 所 以 要 在 旧 的 JDK 中 支持 这 部 分 功能 ， 以 独立 类 库 的 方式 便 可 实 


现 。Retrotranslator 中 附带 了 一 个 名 叫 "backport-util-concurrent.jar" 的 类 


库 (由 另 一 个 名 为 "Backport ot JSR 166" 的 项 目 所 提供 ) 来 代替 JDK 1.5 
的 并 发 包 。 


至 于 JDK 在 编译 阶段 进行 处 理 的 那些 改进 ，Retrotranslator 则 是 使 用 
ASM 框 架 直 接 对 字 节 码 进 行 处 理 。 由 于 组 成 Class 文 件 的 字 节 码 指令 数 
量 并 没有 改变 ， 所 以 无 论 是 JDK 1.3、JDK 1.4 还 是 JDK 1.5， 能 用 字 节 
码 表达 的 语义 范围 应 该 是 一 致 的 。 当 然 ， 肯 定 不 可 能 简单 地 把 Class 的 
文件 版 本 号 从 49.0 改 回 48.0 就 能 解决 问题 了 ， 虽 然 字 节 码 指令 的 数量 没 
有 变化 ， 但 是 元 数据 信息 和 一 些 语法 支持 的 内 容 还 是 要 做 相应 的 修 
改 。 以 枚 举 为 例 ， 在 JDK 1.5 中 增加 了 了 enum 关键 字 ， 但 是 Class 文 件 常量 
池 的 CONSTANT_Class_info 类 型 常量 并 没有 发 生 任何 语义 变化 ， 仍 然 
是 代表 一 个 类 或 接口 的 符号 引用 ， 没 有 加 入 枚 举 ， 也 没有 增加 
过 "CONSTANT_Enum_info" 之 类 的 “ 枚 举 符 号 引用 ”常量 。 所 以 使 用 
enum 关 键 字 定义 常量 ， 虽 然 从 Java 语 法 上 看 起 来 与 使 用 class 关 键 字 定 
义 类 、 使 用 interface 关 键 字 定义 接口 是 同一 层次 的 ， 但 实际 上 这 是 由 
Javac 编 译 器 做 出 来 的 假象 ， 从 字 节 码 的 角度 来 看 ， 枚 举 仅仅 是 一 个 继 
承 于 java.lang.Enum、 目 动 生 成 了 values0 和 valueOfO 方 法 的 普通 Java 类 
而 已 。 


Retrotranslator 对 枚 举 所 做 的 主要 处 理 就 是 把 枚 举 类 的 父 类 
从 "java.lang.Enum" 和 替换 为 它 运 行 时 类 库 中 包含 


的 "net.sf.retrotranslatorruntime.java.lang.Enum_"， 然 后 再 在 类 和 字段 的 


访问 标志 中 抹 去 ACC_ENUM 标 志 位 。 当 然 ， 这 只 是 处 理 的 总 体 思 路 ， 

具体 的 实现 要 比 上 面 说 的 复杂 得 多 。 可 以 想象 既然 两 个 父 类 实现 都 不 
一 样 ，values() 和 valueOf0 的 方法 自然 需要 重 写 ， 常 量 池 需 要 引入 大 量 
新 的 来 自 父 类 的 符号 引用 ， 这 些 都 是 实现 细 证 。 图 9-3 是 一 个 使 用 JDK 
1.5 编 译 的 枚 举 类 与 被 Retrotranslator 转 换 处 理 后 的 字 节 码 的 对 比 图 。 


D:\Source\Concole\WebContent \WEB-INF\classes\console... 瑟 [ 别 [有 
机 Ce | Minor version. 0 
HM Constant Pool Major version. 49 
| Interfaces Constant pool count: 54 
HM Fields Access flags: 0x4031 [fpublic final enum]] 
HD Methods This class: cp _info #1 < fenix/console/domai 
DD Attributes Super class: cp_info #5 |<java/lane/Enum> 
Interfaces count : 0 
Fields count - 5 
Methods count: = 
Attributes count : 2 
可 5:\Users\Thinlpad\Desktop\ServerStatus class [= [ES 
= Minor version.: 0 
Interfaces Constant pool count: TS 
Fields Access flags: 0x0031| [publie final ] 
| Methods This class: cp info #2 < fenix/console/domai 
JU Attributes Super class: cp_ info 5 [Cnet/sE/retrotranslat] 
Interfaces count - 0 
Fields count : 5 
Methods count : = 
Attributes count : 3 


图 9-3 Retrotranslator 处 理 前 后 的 枚 举 类 字 节 人 码 对 比 
[1]Retrotranslator 官 方 站 点 : http://retrotranslator.sf.net 。 


[2] 如 果 想 了 解 编译 器 在 这 个 阶段 所 做 的 各 种 动作 的 详细 人 信息， 那么 可 
以 参考 10.3 节 。 


[3]JSR-133: Java Memory Model and Thread Specification Revision (Java 
内 存 模型 和 线程 规范 修订 ) 。 


9.3 ”实战 : 目 己 动手 实现 远程 执行 功能 


不 知道 读者 在 做 程序 维护 的 时 候 是 否 遇 到 过 这 类 情形 : 排查 问题 
的 过 程 中 ， 想 查看 内 存 中 的 一 些 参 数值 ， 却 又 没有 方法 把 这 些 值 输出 
到 界面 或 日 志 中 ， 叉 或 者 定位 到 某 个 绥 存 数据 有 问题 ， 但 缺少 缓存 的 
统一 管理 界面 ， 不 得 不 重 局 服务 才能 清理 这 个 缓存 。 类 似 的 需求 有 一 
个 共同 的 特点 ， 那 束 是 只 要 在 服务 中 执行 一 段 程序 代码 ， 束 可 以 定位 
或 排除 问题 ， 但 就 古 偏偏 找 不 到 可 以 让 服务 器 执行 临时 代码 的 途径 ， 
这 时 候 束 会 希望 Java 服 务 器 中 也 有 提供 类 似 Groovy Console 的 功能 。 


JDK 1.6 之 后 提供 了 Compiler API， 可 以 动态 地 编译 Java 程 序 ， 虽 

然 这 样 达 不 到 动态 语言 的 灵活 度 ， 但 让 服务 器 执行 临时 代码 的 需求 就 
可 以 得 到 解决 了 。 在 JDK 1.6 之 前 ， 也 可 以 通过 其 他 方式 来 做 到 ， 壁 如 
写 一 个 JSP 文 件 上 传 到 服务 器 ， 然 后 在 浏览 器 中 运行 它 ， 或 者 在 服务 端 
程序 中 加 入 一 个 BeanShell Script、JavaScript 等 的 执行 引擎 (如 Mozilla 
Rhinol) 去 执行 动态 脚本 。 在 本 章 的 实战 部 分 ， 我 们 将 使 用 前 面 学 到 
的 关于 类 加 载 及 虚拟 机 执行 子 系统 的 知识 去 实现 在 服务 端 执行 临时 代 
码 的 功能 。 


9.3.1 目标 


首先 ， 在 实现 “在 服务 端 执 行 临时 代码 ”这 个 需求 之 前 ， 先 来 明确 
一 下 本 次 实战 的 具体 目标 ， 我 们 希望 最 终 的 产品 是 这 样 的 : 


不 依赖 JDK 上 版本， 能 在 目前 还 普 遇 使 用 的 JDK 中 部 署 ， 也 残 是 使 
用 JDK 1.4~JDK 1.7 都 可 以 运行 。 


不 改变 原 有 服务 端 程序 的 部 署 ， 不 依赖 任何 第 三 方 类 库 。 


不 侵入 原 有 程序 ， 即 无 须 改 动 原 程序 的 任何 代码 ， 也 不 会 对 原 有 
程序 的 运行 市 来 任何 影响 。 


考 到 BeanShell Script 或 JavaScript 等 脚本 编写 起 来 不 太 方 便 ，“I 临 时 
代码 ”需要 直接 支持 Java 语 言 。 


“临时 代码 ”应 当 具 备 足够 的 目 由 度 ， 不 需要 依赖 特定 的 类 或 实现 
特定 的 接口 。 这 里 写 的 是 “不 需要 ”而 不 是 “不 可 以 ”， 当 “临时 代码 ?” 需 
要 引用 其 他 类 库 时 也 没有 限制 ， 只 要 服务 端 程序 能 使 用 的 ， 临 时 代码 
应 当 都 能 直接 引用 。 


“临时 代码 ”的 执行 结 采 能 返回 到 客户 端 ， 执 行 结 果 可 以 包括 程序 
中 输出 的 信息 及 抛 出 的 异常 等 。 


看 完 上 面 列 出 的 目标 ， 你 觉得 完成 这 个 需求 需要 做 多 少 工作 呢 ? 
也 许 答案 比 大 多 数 人 所 想 的 都 要 简单 一 些 : 5 个 类 ，250 行 代码 ( 含 注 


释 ) ， 大 约 一 个 半 小 时 左右 的 开发 时 间 就 可 以 了 ， 现 在 就 开始 编写 程 
序 吧 1 


[1]Rhino 站 点 : http://www.mozilla.org/rhino/，Rhino 已 被 收编 入 JDK 1.6 
中 o 


9.3.2 思路 


在 程序 实现 的 过 程 中 ， 我 们 需要 解决 以 下 3 个 问题 : 
如 何 编 译 提 交 到 服务 右 的 Java 代 码 ? 

如 何 执行 编译 之 后 的 Java 代 码 ? 

如 何 收集 Java 代 码 的 执行 结 采 ? 


对 于 第 一 个 问题 ， 我 们 有 两 种 思路 可 以 选择 ， 一 种 是 使 用 tools.jar 
包 (在 Sun JDK/ib 目 录 下 ) 中 的 com.sun.tools.jjavac.Main 类 来 编译 Java 
文件 ， 这 其 实 和 使 用 Javac 命 令 编译 是 一 样 的 。 这 种 思路 的 缺点 是 引入 
了 额外 的 JAR 包 ， 而 且 把 程序 “ 绑 死 "在 Sun 的 JDK 上 了 ， 要 部 署 到 其 他 
公司 的 JDK 中 还 得 把 tools.jar 带 上 (虽然 JRockit 和 J9 虚 拟 机 也 有 这 个 
JAR 包 ， 但 它 总 不 是 标准 所 规定 必须 存在 的 ) 。 另 外 一 种 思路 是 直接 
在 客户 端 编 译 好 ， 把 字 节 码 而 不 是 Java 代 码 传 到 服务 端 ， 这 听 起 来 好 
像 有 点 投机 取 巧 ， 一 般 来 说 确实 不 应 该 假定 客户 端 一 定 具 有 编译 代码 
的 能 力 ， 但 是 既然 程序 员 会 写 Java 代 码 去 给 服务 端 排查 问题 ， 那 么 很 
难 想象 他 的 机 器 上 会 连 编译 Java 程 序 的 环境 都 没有 。 


对 于 第 二 个 问题 ， 人 简单 地 一 想 : 要 执行 编译 后 的 Java 代 码 ， 让 类 
加 载 硕 加 载 这 个 类 生成 一 个 Class 对 象 ， 然 后 反射 调用 一 下 某 个 方法 吏 


可 以 了 (因为 不 实现 任何 接口 ， 我 们 可 以 借用 一 下 Java 中 人 人 篆 知 
的 "main0" 方 法 ) 。 但 我 们 还 应 该 考虑 得 更 周全 些 : 一 段 程序 往往 不 是 
编写 、 运 行 一 次 整 能 达到 效果 ， 同 一 个 类 可 能 要 反复 地 修改 、 提 交 、 
执行 。 男 外 ， 提 交 上 去 的 类 要 能 访问 服务 端的 其 他 类 库 才 行 。 还 有 ， 
既然 提交 的 是 临时 代码 ， 那 提交 的 Java 类 在 执行 完 后 束 应 当 能 季 载 和 
回收 。 


最 后 的 一 个 问题 ， 我 们 想 把 程序 往 标准 输出 (System.out) 和 标准 
普 误 输 出 (System.err) 中 打印 的 信息 收集 起 来 ， 但 标准 输出 设备 是 整 
个 虚拟 机 进程 全 局 共享 的 资源 ， 如 条 使 用 
System.setOut()/System.setErr() 方 法 把 输出 流 重 定 问 到 自己 定义 的 
PrintStream 对 象 上 固然 可 以 收集 输出 信息 ， 但 也 会 对 原 有 程序 产生 影 
响 : 会 把 其 他 线程 向 标准 输出 中 打印 的 信息 也 收集 了 。 虽 然 这 些 并 不 
是 不 能 解决 的 问题 ， 不 过 为 了 达到 完全 不 影响 原 程序 的 目的 ， 我 们 可 
以 采用 另外 一 种 办 法 ， 即 直接 在 执行 的 类 中 把 对 System.out 的 符号 引用 
奉 换 为 我 们 准备 的 PrintStream 的 符号 引用 ， 依 赖 前 面 学 习 的 知识 ， 做 
到 这 一 点 并 不 困难 。 


9.3.3 ”实现 


在 程序 实现 部 分 ， 我 们 主要 看 一 下 代码 及 其 注释 。 首 先 看 看 实现 
过 程 中 需要 用 到 的 4 个 支持 类 。 第 一 个 类 用 于 实现 “同一 个 类 的 代码 可 
以 被 多 次 加 载 * 这 个 需求 ， 即 用 于 解决 9.3.1 市 中 列举 的 第 2 个 问题 的 
HotSwapClassLoader， 具 体 程 序 如 代码 清单 9-3 所 示 。 


代码 清单 9-3 ”HotSwapClassLoader 的 实现 


<* * 

* 为 了 多 次 载 入 执行 类 而 加 入 的 加 载 器 <br > 

* 把 defineClass 方 法 开放 出 来 ， 只 有 外 部 显 式 调 用 的 时 候 才 会 使 用 到 loadByte 方 法 
* 由 虚拟 机 调用 时 ， 仍 然 按照 原 有 的 双亲 委派 规则 使 用 loadclass 方 法 进行 类 加 载 


*@author zzm 

Sf 

public class HotSwapClassLoader extends ClassLoadert{ 
public HotSwapClassLoader(){ 

super (HotSwapClassLoader.class.getClassLoader()): 


} 
public Class loadByte (byte[]classByte) { 


return defineClass (null,classByte, 0, classByte.1length) ; 
} 


} 

HotSwapClassLoader 所 做 的 事情 仅仅 是 公开 父 类 ( 即 
java.lang.ClassLoader) 中 的 protected 方 法 defineClass()， 我 们 将 会 使 用 
这 个 方法 把 提交 执行 的 Java 类 的 byte[] 数 组 转变 为 Class 对 象 。 
HotSwapClassLoader 中 并 没有 重 写 loadClass() 或 findClass0 方 法 ， 因 此 
如 有 果 不 算 外 部 手工 调用 loadByte() 方 法 的 话 ， 这 个 类 加 载 器 的 类 查找 泡 


围 与 它 的 父 类 加 载 器 是 完全 一 致 的 ， 在 被 虚拟 机 调用 时 ， 它 会 按照 双 
亲 委 派 模型 交 给 父 类 加 载 。 构 造 函 数 中 指定 为 加 载 
HotSwapClassLoader 类 的 类 加 载 器 作为 父 类 加 载 器 ， 这 一 步 是 实现 提 
交 的 执行 代码 可 以 访问 服务 端 引 用 类 库 的 关键 ， 下 面 我 们 来 看 看 代码 
清单 9-3。 


第 二 个 类 是 实现 将 java.lang.System 替 换 为 我 们 自己 定义 的 
HackSystem 类 的 过 程 ， 它 直接 修改 符合 Class 文 件 格 式 的 byte[] 数 组 中 
的 常量 池 部 分 ， 将 常量 池 中 指定 内 容 的 CONSTANT_Utf8_info 常 量 霍 
换 为 新 的 字符 串 ， 具 体 代 码 如 代码 清单 9-4 所 示 。ClassModifier 中 涉及 
对 byte[] 数 组 操作 的 部 分 ， 主 要 是 将 byte[] 与 int 和 String 互 相 转 换 ， 以 及 
把 对 byte[] 数 据 的 奉 换 操作 封 逆 在 代码 请 单 9-5 所 示 的 ByteUtils 中 。 


代码 清单 9-4 ”ClassModifier 的 实现 


hs 

* 修 改 CLlass 文 件 ， 和 暂时 只 提供 修改 常量 池 常 量 的 功能 

*Q@author zzm 

public class ClassModifier{ 

/A 

*Class 文 件 中 常量 池 的 起 始 偏 移 

*/ 

private static final int CONSTANT_POOL_COUNT_INDEX=8; 

AE 

*CONSTANT_Utf8_info 常 量 的 tag 标 志 

4 

private static final int CONSTANT_Utf8_info=1:; 

hs 

* 常 量 池 中 11 种 常量 所 占 的 长 度 ，CONSTANT_Utf8_info 型 常量 除外 ， 因 为 它 不 是 定 长 
的 

六 


private static final int[]CONSTANT_ITEM LENGTH={-1, -1, -1, 5, 5, 
9 9,.3. 3 5 5Y.5, 95: 

private static final int ui1=1; 

private static final int u2=2; 

private byte[]jclassByte; 

public ClassModifier (byte[]classByte) { 

this.classByte=classByte:; 

} 

hs 

* 修 改 常 量 池 中 CONSTANT_Utf8_info 常 量 的 内 容 

*@param ol1dStr 修 改 前 的 字符 串 

*@param newStr 修 改 后 的 字符 串 

*Q@return 修 改 结果 

*/ 

public byte[]modifyUTF8Constant (String oldStr,String newStr) { 

int cpc=getConstantPoolCount(); 

int offset=CONSTANT_POOL_COUNT_INDEX+U2 ; 

for (int i=0; i<cpc; i++) { 

int tag=ByteUtils.bytes2Int (classByte,offset,u1) ; 

if (tag==CONSTANT_Utf8_info) { 

int len=ByteUtils.bytes2Int (CLassByte,offset+u1，U2) ; 

offset+= (U1+U2) ; 

String str=ByteUtils.bytes2String (classByte,offset,1len) ; 

if (str.equalsIgnoreCase (olLdStr) ) { 

byte[]jstrBytes=ByteUtils.string2Bytes (newStr) ; 

byte[]strLen=ByteUtils.int2Bytes (newStr.length(), u2); 

classByte=ByteUtils.bytesReplace (classByte,offset-u2, u2, 
strLen) ; 

classByte=ByteUtils.bytesReplace 

(classByte, offset, len, strBytes) ; 
return classByte.; 


}elsef{ 

offset+=len.; 

} 

}elsef{ 
offset+=CONSTANT_ITEM_LENGTH[tadg ] ; 
} 

} 

return classByte.; 

} 

pA 

* 获 取 常 量 池 中 常量 的 数量 
*@return 常 量 池 数量 

*/ 


public int getConstantPoolCount(){ 
return ByteUtils.bytes2Int 
(classByte,CONSTANT_POOL COUNT_INDEX, u2) ; 


} 


代码 清单 9-5 ”ByteUtils 的 实现 


pA 
*Bytes 数 组 处 理工 具 
*Q@author 
*/ 

public class ByteUtilst{ 

public static int bytes2Int (byte[]b,int start,int len) { 
int sum=0; 

int end=start+len:; 

for (int i=start; i<end; i++) { 

int n= ( (int) b[i]) &Oxff; 

n<<= (--len) *8; 

sum=nNn+Ssum; 

} 

return sum; 

} 

public static byte[]int2Bytes (int value,int len) { 
byte[]jb=new byte[len]; 

for (int i=0; i<len; i++) { 

b[len-i-1]= (byte) ( (value> >8*i) &0Oxff) ; 

} 

return b; 

} 

public static String bytes2String (byte[]b,int start,int len) { 
return new String (b,start,1len) ; 

} 

public static byte[]jstring2Bytes (String str) { 

return str.getBytes(); 


public static byte[]bytesReplace (byte[]joriginalBytes, int 
offset,int len,byte[]replaceBytes) { 
byte[]jnewBytes=new byte[originalBytes.1length+ 
(replaceBytes.length-1len) ]; 
System.arraycopy (originalBytes, 0, newBytes, 0, offset) ; 
System.arraycopy (replaceBytes, 0, 
newBytes, offset,replaceBytes.1length) ; 
System.arraycopy 
(originalBytes, offset+len,newBytes, offset+replaceBytes.length, origi 
nalBytes.length-offset-len) ; 
return newBytes; 


} 
} 


经 过 ClassModifier 处 理 后 的 byte[] 数 组 才 会 传 给 
HotSwapClassLoaderloadByte() 方 法 进行 类 加 载 ，byte[] 数 组 在 这 里 替 
换 符号 引用 之 后 ， 与 客户 端 直 接 在 Java 代 码 中 引用 HackSystem 类 再 编 
译 生成 的 Class 是 完全 一 样 的 。 这 样 的 实现 既 避 免 了 客户 端 编写 临时 执 
行 代 码 时 要 依赖 特定 的 类 〈 不 然 无 法 引入 HackSystem) ， 又 避免 了 服 
务 端 修改 标准 输出 后 影响 到 其 他 程序 的 输出 。 下 面 我 们 来 看 看 代码 清 
单 9-4 和 代码 清单 9-5。 


最 后 一 个 类 就 是 前 面 提 到 过 的 用 来 代替 java.lang.System 的 
HackSystem， 这 个 类 中 的 方法 看 起 来 不 少 ， 但 其 实 除了 把 out 和 err 两 个 
静态 变量 改 成 使 用 ByteArrayOutputStream 作 为 打印 目标 的 同一 个 
PrintStream 对 象 ， 以 及 增加 了 读 取 、 清 理 ByteArrayOutputStream 中 内 
容 的 getBufferString() 和 clearBuffer() 方 法 外 ， 就 再 没有 其 他 新 鲜 的 内 容 
了 。 其 余 的 方法 全 部 都 来 自 于 System 类 的 public 方 法 ， 方 法 名 字 、 参 
数 、 返 回 值 都 完全 一 样 ， 并 且 实 现 也 是 直接 转调 了 System 类 的 对 应 方 
法 而 已 。 保 留 这 些 方法 的 目的 ， 是 为 了 在 Sytem 被 替换 成 HackSystem 
之 后 ， 执 行 代 码 中 调用 的 System 的 其 余 方 法 仍然 可 以 继续 使 用 ， 
HackSystem 的 实现 如 代码 清单 9-6 所 示 。 


代码 清单 9-6 ”HackSystem 的 实现 


/A* * 
* 为 JavaClass 动 持 java.1lang .System 提 供 支持 


上 


* 除 了 out 和 err 外 ， 其 余 的 都 直接 转发 给 System 处 理 


*@author zzm 

4 

public class HackSystemt{ 

public final static InputStream in=System.in; 

private static ByteArrayOutputStream buffer=new 
ByteArrayOutputStream( ); 

public final static PrintStream out=new PrintStream (buffer) ; 

public final static PrintStream err=out; 

public static String getBufferString()t{ 

return buffer.toString(); 

} 

public static void clearBuffer(){ 

buffer.reset(); 

} 

public static void setSecurityManager (final SecurityManager s) { 

System.setSecurityManager (S) ; 

} 

public static SecurityManager getSecurityManager()t{ 

return System.getSecurityManager(); 

} 

public static long currentTimeMil]lis(){ 

return System.currentTimeMillis(); 

} 

public static void arraycopy (Object src,int srcPos,0bject 
dest, int destPos,int length) { 

System.arraycopy (src,srcPos,dest,destPos, length) : 

} 

public static int identityHashCode (Object x) { 

return System.identityHashCode (x) ; 

} 

// 下 面 所 有 的 方法 都 与 java.1lang .System 的 名 称 一 样 

// 实 现 都 是 字 节 转调 System 的 对 应 方法 

// 因 版 面 原因 ， 省 略 了 其 他 方法 

} 


至 此 ，4 个 支持 类 已 经 讲解 完毕 ， 我 们 来 看 看 最 后 一 个 类 
JavaClassExecuter， 它 是 提供 给 外 部 调用 的 入 口 ， 调 用 前 面 儿 个 支持 类 
组 装 逻辑 ， 完 成 类 加 载 工 作 。JavaClassExecuter 只 有 一 个 execute() 方 
法 ， 用 输入 的 符合 Class 文 件 格式 的 byte[] 数 组 奉 换 java.lang.System 的 符 


号 引用 后 ， 使 用 HotSwapClassLoader 加 载 生成 一 个 Class 对 象 ， 由 于 

次 执行 execute() 方 法 都 会 生成 一 个 新 的 类 加 载 器 实例 ， 因 此 同一 个 类 

可 以 实现 重复 加 载 。 然 后 ， 反 射 调用 这 个 Class 对 象 的 main() 方 法 ， 如 

果 期 间 出 现任 何 异 常 ， 将 异 当 信息 打印 到 HackSystem.out 中 ， 最 后 把 

绥 冲 区 中 的 信息 作为 方法 的 结果 返回 。JavaClassExecuter 的 实现 代码 如 
代码 清单 9-7 所 示 。 


代码 清单 9-7” JavaClassExecuter 的 实现 


yA 
*JavaClass 执 行 工具 
* 


*@author zzm 
*/ 
public class JavaClassExecutert{ 
A 
* 执 行 外 部 传 过 来 的 代表 一 个 Java 类 的 byte 数 组 <br > 
* 将 输入 类 的 byte 数 组 中 代表 java .lang .System 的 CONSTANT_Utf8_info 常 量 修改 
为 动 持 后 的 HackSystem 类 
* 执 行 方法 为 该 类 的 static main (String[]args) 方法 ， 输 出 结果 为 该 类 向 
System.out/err 输 出 的 信息 
*@param classByte 代 表 一 个 Java 类 的 byte 数 组 
*Q@return 执 行 结果 
本 
public static String execute (byte[]classByte) { 
HackSystem.clearBuffer(); 
ClassModifier cm=new ClassModifier (classByte) ; 
byte[ JmodiBytes=cm.modifyUTF8Constant 
("java/lang/System", "org/fenixsoft/classloading/execute/HackSystem 


HotSwapClassLoader loader=new HotSwapClassLoader(); 

Class clazz=loader.loadByte (modiBytes) ; 

try{ 

Method method=clazz.getMethod ("main", new Class[] 
{String[] .class}) ; 

method.invoke (null,new String[]{null}) ; 

}catch (Throwable e) { 

e.printStackTrace (HackSystem.out) ; 


} 
return HackSystem.getBufferString(); 


} 
} 


9.34d 全 证 


远程 执行 功能 的 编码 到 此 束 完 成 了 ， 接 下 来 束 要 检验 一 下 我 们 的 
劳动 成 果 了 。 如 果 只 是 测试 的 话 ， 那 么 可 以 任意 写 一 个 Java 类 ， 内 容 无 
所 谓 ， 只 要 癌 System.out 和 输出 信息 即 可 ， 取 名 为 TestClass， 同 时 放 到 服 
务 絮 C 盘 的 根 目 录 中 。 然 后 ， 建 立 一 个 JSP 文 件 并 加 入 如 代码 清单 9-8 所 
示 的 内 容 ， 就 可 以 在 浏 哎 右 中 看 到 这 个 类 的 运行 结果 了 。 


代码 清单 9-8 测试 JSP 


<%@page import="java.lang.*"%> 

<%@page import="java.io.*"%> 

<%@page import="org.fenixsoft.classloading.execute.*"%> 
<% 

InputStream is=new FileInputStream ("c:/TestClass.class") ; 
byte[]jb=new bytel[is.available( )]: 

is.read (b) ; 

is.closel( ); 

out .println ("<textarea style='width:1000; height=800' >") ; 


out.println (JavaClassExecuter.execute (b) ) ; 


out .println ("</textarea>") 
%> 


当然 ， 上 面 的 做 法 只 是 用 于 测试 和 演示 ， 实 际 使 用 这 个 
JavaExecuter 执 行 句 的 时 候 ， 如 采 还 要 手工 复制 一 个 Class 文 件 到 服务 天 
上 就 没有 什么 意义 了 。 笔 者 给 这 个 执行 器 写 了 一 个 “外 这 ?"， 是 一 个 
Eclipse 插 件 ， 可 以 把 Java 文 件 编译 后 传输 到 服务 右 中 ， 人 然后 把 执行 右 的 
返回 结果 输出 到 Eclipse 的 Console 窗 口 里 ， 这 样 就 可 以 在 有 灵感 的 时 候 


随时 写 几 行 调试 代码 ， 放 到 测试 环境 的 服务 器 上 立即 运行 了 。 虽 然 实 
现 简 单 ， 但 效果 很 不 错 ， 对 调试 问题 也 非常 有 用 ， 如 图 9-4 所 示 。 


下 = = 
4 二 为 。 Refresh Tasks Ctrl+F5 
com 
3 yefnis hpply Checkstyle fixes 
pi RemoteT Run As » 
| testold Debug As 人 
[a .classpath 
; Profile As 上 
园 .Project 一- | 
(3 build prop 在 服务 器 上 运行 Fenix 192. 168. 32. 62 


图 。9-4 JavaClassExecuter 的 使 用 


9.4 ”本章 小 结 


本 书 第 6~9 章 介绍 了 Class 文 件 格式 、 类 加 载 及 虚拟 机 执行 引擎 几 
部 分 内 容 ， 这 些 内 容 是 虚拟 机 中 必 不 可 少 的 组 成 部 分 ， 只 有 了 解 了 虚 
拟 机 如 何 执行 程序 ， 才 能 更 好 地 理解 怎样 写 出 优秀 的 代码 。 


关于 虚拟 机 执行 子 系统 的 介绍 到 此 整 结 束 了 ， 通 过 这 4 章 的 讲解 ， 
我 们 描绘 了 一 个 虚拟 机 应 该 上 怎 样 运行 Class 文 件 的 概念 模型 。 对 于 具体 
到 某 个 虚拟 机 的 实现 ， 为 了 使 实现 简单 、 清 晰 ， 或 者 为 了 更 快 的 运行 
速度 ， 在 虚拟 机 内 部 的 运作 跟 概 念 模型 可 能 会 有 非常 大 的 差异 ， 但 从 
最 终 的 执行 结 采 来 看 应 该 是 一 致 的 。 从 第 10 章 开始 ， 我 们 将 探索 虚拟 
机 在 语法 和 运行 性 能 上 是 如 何 对 程序 编写 做 出 各 种 优化 的 。 


第 四 部 分 “程序 编译 与 代码 优化 
第 10 章 ”早期 (编译 期 ) 优化 
第 11 章 ”晚期 (运行 期 ) 优化 
第 10 草 ”早期 (编译 期 ) 优化 


从 计算 机 程序 出 现 的 第 一 天 起 ， 对 效率 的 追求 就 是 程序 天 生 的 坚 
定 信 仰 ， 这 个 过 程 犹 如 一 场 没 有 终点 、 永 不 集 欣 的 F1 方 程式 竞赛 ， 程 
予 员 是 车 手 ， 技 术 平 台 则 有 是 在 赛 道上 飞驰 的 赛车 。 


10.1 概述 


Java 语 言 的 “编译 期 ?其实 是 一 段 “ 不 确定 ”的 操作 过 程 ， 因 为 它 可 
能 是 指 一 个 前 端 编译 器 (其 实 叫 “编译 器 的 前 端 " 更 准确 一 些 ) 把 *.java 
文件 转变 成 *.class 文 件 的 过 程 ; 也 可 能 是 指 虚 拟 机 的 后 端 运行 期 编译 
器 (JIT 编 译 器 ，Just mn Time Compiler) 把 字 节 码 转变 成 机 器 码 的 过 
程 ， 还 可 能 是 指使 用 静态 提前 编译 器 (AOT 编 译 器 ，Ahead Of Time 
Compiler) 直接 把 *.java 文 件 编译 成 本 地 机 器 代码 的 过 程 。 下 面 列举 了 
这 3 类 编译 过 程 中 一 些 比较 有 代表 性 的 编译 器 。 


前 端 编译 器 : Sun 的 Javac、Eclipse JDT 中 的 增 量 式 编译 器 (ECJ) 
[1] 。 


JIT 编 译 器 : HotSpot YM 的 C1、C2 编 译 器 。 


AOT 编 译 器 : GNU Compiler for the Java (GCJ) ("| 、Excelsior 
JETH] 。 


这 3 类 过 程 中 最 符合 大 家 对 Java 程 序 编 译 认 知 的 应 该 是 第 一 类 ， 在 
本 章 的 后 续 文 字 里 ， 笔 者 提 到 的 “编译 期 ?和 “编译 需 ?" 都 仅 限于 第 一 类 
编译 过 程 ， 把 第 二 类 编译 过 程 留 到 下 一 革 中 讨论 。 限 制 了 编译 范围 
后 ， 我 们 对 于 “优化 ”二 字 的 定义 吏 需 要 宽松 一 些 ， 因 为 Javac 这 类 编译 
器 对 代码 的 运行 效率 几乎 没有 任何 优化 措施 (在 JDK 1.3 之 后 ，Javac 
的 -O 优 化 参数 就 不 再 有 意义 ) 。 虚 拟 机 设计 团队 把 对 性 能 的 优化 集中 
到 了 后 端的 即时 编译 种 中 ， 这 样 可 以 让 那些 不 是 由 Javac 产 生 的 Class 文 
件 (如 JRuby、Groovy 等 语言 的 Class 文 件 ) 也 同样 能 享受 到 编译 器 优 
化 所 带 来 的 好 处 。 但 是 Javac 做 了 许多 针对 Java 语 言 编码 过 程 的 优化 措 
施 来 改善 程序 员 的 编码 风格 和 提高 编码 效率 。 相 当 多 新 生 的 Java 语 法 
等 性， 都 是 靠 编译 器 的 “语法 糖 ?来 实现 ， 而 不 是 依赖 虚拟 机 的 夺 层 改 
进来 文 持 ， 可 以 说 ，Java 中 即时 编译 硕 在 运行 期 的 优化 过 程 对 于 程序 
运行 来 说 更 重要 ， 而 前 端 编译 融 在 编译 期 的 优化 过 程 对 于 程序 编码 来 
说 关系 更 加 密切 。 


[1]JDT 官 方 站 点 : http://www.eclipse.org/jdt/。 
[2]GCJ 官 方 站 点 : http://gcc.gnu.org/java/° 


[3]Excelsior JET 官 方 站 点 : http:/www.excelsior-usa.com/ 。 


10.2 ”Javac 编 译 器 


分 析 源 码 是 了 解 一 项 技术 的 实现 内 项 最 有 效 的 手段 ，Javac 编 译 天 
不 像 HotSpot 虚 拟 机 那样 使 用 C++ 语言 (包含 少量 C 语 言 ) 实现 ， 它 本 刁 
就 是 一 个 由 Java 语 言 编写 的 程序 ， 这 为 纯 Java 的 程序 员 了 解 它 的 编译 过 
程 沉 来 了 很 大 的 便利 。 


10.2.1 Javac 的 源码 与 调试 


Javac 的 源码 存放 在 
JDK_SRC_HOME/langtools/src/share/classes/com/sun/tools/javac 中 由 ， 除 
了 JDK 自 身 的 API 外 ， 就 只 引用 了 
JDK_SRC_HOME/langtools/src/share/classes/com/sun* 里 面 的 代码 ， 调 
试 环境 建立 起 来 简单 方便 ， 因 为 基本 上 不 需要 人 处理 依赖 关系 。 


以 Eclipse IDE 环 境 为 例 ， 先 建立 一 个 名 为 "Compiler_ javac" 的 Java 工 
程 ， 然 后 把 JDK_SRC_HOME/langtools/src/share/classes/com/sun/* 目 条 
下 的 源 文 件 全 部 复制 到 工程 的 源码 目录 中 ， 如 图 10-1 所 示 。 


则 Fackage Explorer 


< 


4 降 | Compiler javac | 
b EE .settings 
by E> bin 
4 人 src 
4 com 
4 1 su 
>》 区 javadoe 
>》 和 mirror 
》 i source 
> tools 
> EE org 
i .classpath 
中 .Project 


图 10-1 Eclipse 中 的 Javac 工 程 


导入 代码 期 间 ， 源 码 文件 "AnnotationProxy Makerjava" 可 能 会 提 


示 "Access Restriction"， 被 Eclipse 拒绝 编译 ， 如 图 10-2 所 示 。 


ynamic proxy for an annotation mirror. 


private Annotation generateAnnotation() { 


return Mnnotatiohparser.annotationForMap lannoTyps. 


~ OAccess restriction: The method annotationForlMap (Class, Map<Strine, Object>) 
hrmotationFarser is not accessible due to restriction on requlred library 
D:\ DevSpace\jdkl.6.0 21\jre\lib\rt. jar 


图 。 10-2 AnnotationProxyMaker 被 拒绝 编译 


这 是 由 于 Eclipse 的 JRE System Library 中 默认 包含 了 一 系列 的 代码 
访问 规则 (Access Rules) ， 如 果 代码 中 引用 了 这 些 访问 规则 所 禁止 引 


用 的 类 ， 束 会 提示 这 个 错误 。 可 以 通过 添加 一 条 人 允许 访问 JAR 包 中 所 有 
类 的 访问 规则 来 解决 这 个 问题 ， 如 图 10-3 所 示 。 


Java Build Path 


[对 source | [D3 Projects| BN Libraries | > Order and Export 
e 


和” JARs and class folders on the build path. 
yment descriptc 
到 JRE System Library [JavaSE-1,6] 
6 hccess rules: 1 rules[(s) defined added to s 
a Hative library location: (Wone) 
I resources. jar — D:\ ti rid bod 6.0 _21\ el 
- 二 全 


Ivpe Access Rules 和 Be 


Specify access rules for the library 'JRE System Library 
[JavaSE-1.6] . 

When accessing a type in a library child entry, these rules are 
processed top down until a rule pattern matches. When no pattern 
matches, the rules defined for library child entry are taken. 
Access rules: 


vAccassible 素 炒 hdd... 


图 10-3 设置 访问 规则 


导入 了 Javac 的 源码 后 ， 束 可 以 运行 com.sun.tools.javac.Main 的 
main() 方 法 来 执行 编译 了 ， 与 命令 行 中 使 用 Javac 的 命令 没有 什么 区 
别 ， 编 译 的 文件 与 参数 在 Eclipse 的 "Debug Configurations" 面 板 中 
的 "Arguments" 页 签 中 指定 。 


虚拟 机 规范 严格 定义 了 Class 文 件 的 格式 ， 但 是 《Java 虚 拟 机 规范 
(第 2 版 ) 》 中 ， 虽 然 有 专门 的 一 章 "Compiling for the Java Virtual 
Machine"， 但 都 是 以 举例 的 形式 描述 ， 并 没有 对 如 何 把 Java 源 码 文件 转 
变 为 Class 文 件 的 编译 过 程 进行 十 分 严格 的 定义 ， 这 导致 Class 文 件 编译 
在 某 种 程度 上 是 与 具体 JDK 实 现 相 关 的 ， 在 一 些 极端 情况 ， 可 能 出 现 一 
段 代码 Javac 编 译 器 可 以 编译 ， 但 是 ECJ 编 译 器 就 不 可 以 编译 的 问题 
(10.3.1 节 中 将 会 给 出 这 样 的 例子 。 从 Sun Javac 的 代码 来 看 ， 编 译 过 
程 大 致 可 以 分 为 3 个 过 程 ， 分 别 是 : 


解 术 与 填充 符号 表 过 程 。 
插入 式 注解 处 理 右 的 注解 处 理 过 程 。 
分 析 与 字 市 码 生 成 过 程 。 


这 3 个 步 又 之 间 的 关系 与 交互 顺序 如 图 10-4 所 示 。 


L 注解 处 理 分 析 与 字 节 码 生成 人 
[} Annotation Processing Analyse and Generate 
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图 10-4 Javac 的 编译 过 程 中 


解析 与 填充 符号 表 


Parse and Enter 


Javac 编 译 动作 的 入 口 是 com.sun.tools.javac.main.JavaCompiler 类 ， 


上 二 3 个 过 程 的 代码 逻辑 集中 在 这 个 类 的 compileO 和 compile20) 方 法 中 ， 


其 中 主体 代码 如 图 10-5 所 示 ， 整 个 编译 最 关键 的 处 理 束 由 图 中 标注 的 8 
个 方法 来 完成 ， 下 面 我 们 具体 看 一 下 这 8 个 方法 实现 了 什么 功能 。 


准备 过 程 : 初始 化 插入 式 注解 处 理 器 


ji/ These method calls must be chained to avoid memory leaks 
delegateCompiler = 
processAnnotatinons 过 程 2: 执行 注解 处 理 
stopIfError{CompileState. PARSE,—> 过 程 1.2: 输入 到 符号 表 
sourceFileObject3s}}}， 一 > 过 程 1.1: 词法 分 析 、 语 法 分 析 


classnames}; 


delegateCompiler.compile21{); 过 程 3: 分 析 及 字 节 码 生成 


case BY TODO: 
While {'‘'todo.isEmpty{)) 


break; 


过 程 3.4: 生成 字 节 码 过 程 3.3: 解 语法 糖 过 程 3.2: 数据 流 分 析 过 程 3.1: 标注 


图 10-5 Javac 编 译 过 程 的 主体 代码 
[本 关于 如 何 获取 OpenJDK 源 码 ， 请 参考 本 书 第 1 章 。 
[2] 图 片 来 源 : http://openjdk.java.net/groups/compiler/doc/compilation- 
overview/index.html， 本 书 对 相关 术语 进行 了 翻译 。 


10.2.2 ”解析 与 填充 符号 表 


解析 步骤 由 图 10-5 中 的 parseFiles0) 方 法 (图 10-5 中 的 过 程 1.1) 完 
成 ， 解 析 步 又 包括 了 经 典 程 序 编译 原理 中 的 词法 分 析 和 语法 分 析 两 个 
过 程 。 


1. 词 法 、 语 法 分 析 


词法 分 析 是 将 源 代码 的 字符 流转 变 为 标记 (Token) 集合 ， 单 个 字 
从 是 程序 编写 过 程 的 最 小 元 素 ， 而 标记 则 是 编译 过 程 的 最 小 元 素 ， 关 
字 、 变 量 名 、 字 面 量 、 运 算 符 都 可 以 成 为 标记 ， 如 "int a=b+2" 这 人 句 
代码 包含 了 6 个 标记 ， 分 别 是 int、a、=、b、+、2， 虽 然 关 键 字 int 由 3 
个 字符 构成 ， 但 是 它 只 是 一 个 Token， 不 可 再 拆 分 。 在 Javac 的 源码 
中 ， 词 法 分 析 过 程 由 com.sun.tools.javac.parser.Scanner 类 来 实现 。 


湾 


语法 分 析 是 根据 Token 序 列 构造 抽象 语法 树 的 过 程 ， 抽 象 语法 树 
Abstract Syntax Tree,AST) 是 一 种 用 来 描述 程序 代码 语法 结构 的 树 
形 表示 方式 ， 语 法 树 的 每 一 个 节点 都 代表 着 程序 代码 中 的 一 个 语法 结 
构 (Construct) ， 例 如 包 、 类 型 、 修 饰 符 、 运 算 符 、 接 口 、 返 回 值 其 

至 代码 注释 等 都 可 以 是 一 个 语法 结构 。 


图 10- ee AST View 插 件 分 析出 来 的 某 段 代码 的 抽象 语 
法 树 视 图 ， 读 者 可 以 通过 这 张 图 对 抽象 语法 树 有 一 个 直观 的 认识 
Javac 的 源码 中 ， 语 法 分 析 过 程 由 com.sun.tools.javac.parser.Parser 类 实 
现 ， 这 个 阶段 产 出 的 抽象 语法 树 由 com.sun.tools.javac.tree.JCTree 类 表 
示 ， 经 过 这 个 步 又 之 后 ， 编 译 器 就 基本 不 会 再 对 源码 文件 进行 操作 
了 ， 后 续 的 操作 都 建立 在 抽象 语法 树 之 上 。 


睛 Package Explorer |®5. Havigator 主 ASTView 53 时 =] 


IPortRedirectServer. java (AST Level 3). Creation time: 16 ms. 一 


本 中 其 | 任 | 辑 品 和 气 
了 ADCKAGE 
; IMFORTS (8) 
4 TIFES U1) 
4 TypeDeclaration [342, i493] 
,> type binding: org. fenixsoft. net. PortRedirectServer 
JAVYADOC: null 
， MODIFIERS (1) 
INTERFACE: ' false’ 
， NAME 
TYPE PARAMETERS (0) 
SUPERCLASS_TYPE: rll 
; SUFER INTERFACE TYPES (1) 
a BODY DECLARATIONS (51 
; Fieldleclaration [397, 32] 
; FieldDeclaration [#3#4, 75] 
, 关 ethodDeclaration [Si4, 1131] 
;MethodDeclaration [i650, 75] 
; MethodDeclaration [1730，102] 
> CompilationUnit: or 区 fenixsoft. net, PortRedirectServer. ]aval 
; > comments 总) 
> compiler problems WO) 
;> AST settines 
; > RESOLVE WELL FNOWN _ TYPES 


10-6 ”抽象 语法 树 结构 视图 


完成 了 语法 分 析 和 词法 分 析 之 后 ， 下 一 步 就 是 填充 符号 表 的 过 

程 ， 也 就 是 图 10-5 中 enterTrees() 方 法 (图 10-5 中 的 过 程 1.2) 所 做 的 事 
情 。 符 号 表 (Symbol Table) 是 由 一 组 符号 地 址 和 符号 信息 构成 的 表 
格 ， 读 者 可 以 把 它 想象 成 哈 希 表 中 K-V 值 对 的 形式 (实际 上 符号 表 不 
一 定 是 哈 希 表 实现 ， 可 以 是 有 序 符号 表 、 树 状 符号 表 、 栈 结构 符号 表 

) 。 符 号 表 中 所 登记 的 信息 在 编译 的 不 同 阶段 都 要 用 到 。 在 语义 分 
析 中 ， 符 号 表 所 登记 的 内 容 将 用 于 语义 检查 (如 检查 一 个 名 字 的 使 用 
和 原先 的 说 明 是 否 一 致 ) 和 产生 中 间 人 代码。 在 目标 代码 生成 阶段 ， 当 
对 符号 名 进行 地 址 分 配 时 ， 符 号 表 是 地 址 分 配 的 依据 。 


在 Javac 源 代码 中 ， 填 充 符号 表 的 过 程 由 
com.sun.tools.javac.comp.Enter 类 实现 ， 此 过 程 的 出 口 是 一 个 待 处 理 列 
表 (To Do List) ， 包 含 了 每 一 个 编译 单元 的 抽象 语法 树 的 顶级 节点 ， 
以 及 package-info.java (如 果 存 在 的 话 ) 的 顶级 节点 。 


10.2.3 ”注解 处 理 器 


在 JDK 1.5 之 后 ，Java 语 言 提 供 了 对 注解 (Annotation) 的 文 持 ， 
这 些 注 解 与 普通 的 Java 代 码 一 样 ， 是 在 运行 期 间 发 挥 作用 的 。 在 JDK 
1.6 中 实现 了 JSR-269 规 范 趾 ， 提 供 了 一 组 插入 式 注解 处 理 器 的 标准 API 
在 编译 期 间 对 注解 进行 处 理 ， 我 们 可 以 把 它 看 做 是 一 组 编译 器 的 插 
件 ， 在 这 些 插 件 里 面 ， 可 以 读 取 、 修 改 、 添 加 抽象 语法 树 中 的 任意 元 
素 。 如 果 这 些 插件 在 处 理 注解 期 间 对 语法 树 进行 了 修改 ， 编 译 器 将 回 
到 解析 及 填充 符号 表 的 过 程 重新 处 理 ， 直 到 所 有 插入 式 注解 处 理 器 都 
没有 再 对 语法 树 进行 修改 为 止 ， 每 一 次 循环 称 为 一 个 Round， 也 惑 是 
图 10-4 中 的 回环 过 程 。 


有 了 编译 器 注解 处 理 的 标准 API 后 ， 我 们 的 代码 才 有 可 能 干涉 编 
译 万 的 行为 ， 由 于 语法 树 中 的 任意 元 隶 ， 甚 至 包括 代码 注释 都 可 以 在 
插件 之 中 访问 到 ， 所 以 通过 插入 式 注 解 处 理 亏 实 现 的 插件 在 功能 上 有 
很 大 的 发 挥 空 间 。 只 要 有 足够 的 创意 ， 程 序 员 可 以 使 用 插入 式 注 解 处 
理 如 来 实现 许多 原本 只 能 在 编码 中 完成 的 事情 ， 本 章 最 后 会 给 出 一 个 
使 用 插入 式 注 解 处 理 需 的 倘 单 实战 。 


在 Javac 源 码 中 ， 插 入 式 注 解 处 理 絮 的 初始 化 过 程 是 在 
initPorcessAnnotations() 方 法 中 完成 的 ， 而 它 的 执行 过 程 则 是 在 


processAnnotations() 方 法 中 完成 的 ， 这 个 方法 判断 是 否 还 有 新 的 注解 
处 理 硕 需要 执行 ， 如 果 有 的 话 ， 通 过 
com.sun.tools.javac.processing.JavacProcessingEnvironment 类 的 
doProcessing(0) 方 法 生成 一 个 新 的 JavaCompiler 对 象 对 编译 的 后 续 步 又 
进行 企 理 ” 


[1]JSR-269: Pluggable Annotations Processing API (插入 式 注解 处 理 
API) 。 


10.2.4 语义 分 析 与 字 世 码 生成 


语法 分 析 之 后 ， 编 译 帮 获得 了 程序 代码 的 抽象 语法 树 表 示 ， 语 法 
树 能 表示 一 个 结构 正确 的 源 程 序 的 抽象 ， 但 无 法 保证 源 程序 钙 符 合 逻 
辑 的 。 而 语义 分 析 的 主要 任务 是 对 结构 上 正确 的 源 程序 进行 上 下 文 有 
天 性 质 的 审查 ， 如 进行 类 型 审查 。 举 个 例子 ， 假 设 有 如 下 的 3 个 变量 定 
义 语句 : 


int a=1; 
boolean b=false:; 
char c=2; 


后 续 可 能 出 现 的 赋值 运算 : 


int d=a+C; 

0 

后 续 代 码 中 如 采 出 现 了 如 上 3 种 赋值 运算 的 话 ， 那 它们 都 能 构成 结 
构 正确 的 语法 树 ， 但 是 只 有 第 1 种 的 写法 在 语义 上 是 没有 问题 的 ， 能 够 
通过 编译 ， 其 余 两 种 在 Java 语 言 中 是 不 合 逻 和 错 的 ， 无 法 编译 〈 是 否 合 
乎 语义 逻辑 必须 限定 在 具体 的 语言 与 具体 的 上 下 文 环境 之 中 才 有 总 
义 。 如 在 C 语 言 中 ，a、b、c 的 上 下 文 定义 不 变 ， 第 2、3 种 写法 都 是 可 
以 正确 编译 ) 。 


1. 标 注 检查 


Javac 的 编译 过 程 中 ， 语 义 分 析 过 程 分 为 标注 检查 以 及 数据 及 控制 
流 分 析 两 个 步骤 ， 分 别 由 图 10-5 中 所 示 的 attribute0 和 flow(0) 方 法 (分 别 
对 应 图 10-5 中 的 过 程 3.1 和 过 程 3.2) 完成 。 


标注 检查 步 又 检查 的 内 容 包 括 诸如 变量 使 用 前 是 否 已 侦 声明 、 变 
量 与 赋值 之 间 的 数据 类 型 是 否 能 够 匹配 等 。 在 标注 检查 步 又 中 ， 还 有 
一 个 重要 的 动作 称 为 常量 折 县 ， 如 采 我 们 在 代码 中 写 了 如 下 定义 : 


int a=1+2; 


那么 在 语法 树 上 仍然 能 看 到 字面 量 “1”、“2” 以 及 操作 符 “+”， 但 是 
在 经 过 剃 量 折合 之 后 ， 它 们 将 会 被 折合 为 字面 量 “3”， 如 图 10-7 所 示 ， 
这 个 插入 式 表达 式 (Infix Expression) 的 值 已 经 在 语法 树 上 标注 出 来 
了 (ConstantExpressionValue:3) 。 由 于 编译 期 间 进行 了 常量 折 敬 ， 所 
以 在 代码 里 面 定 义 "a=1+2" 比 起 直接 定义 "a=3"， 并 不 会 增加 程序 运行 
期 哪 旧 仅仅 一 个 CPU 指令 的 运算 量 。 


a INITIALIZER 
4 InfixExpression [105, 5] 
4 > [Expression) type bindine: int 

NANME: ‘int’ 
RET 
IS RECOVERED: false 
QUALIFIED NANME: ”int 
KIND: isPrimitive 
CREATE ARRAY TYPE (+1): int[] 
BINARY NAME: “I* 
ANNOTATIONS (0) 


>jaya element: rull 


Boxine: false; Unboxine: false 
ConstarntExpressloryalue: 3 
4 LEFT OFPERAND 
JamberLiteral [105, 1] 
OPERATOR: “+ 
4 RIGHT OPERAMED 
HumnberLiteral [109, 1] 


10-7 惫 量 折 丢 


标注 检查 步骤 在 Javac 源 码 中 的 实现 类 是 


com.sun.tools.javac.comp.Attr 类 和 com.sun.tools.javac.comp.Check 类 。 


2. 数 据 及 控制 流 分 析 


数据 及 控制 流 分 析 是 对 程序 上 下 文 逻 辑 更 进一步 的 验证 ， 它 可 以 

今 碍 出 诸如 程序 局 部 变量 在 使 用 前 是 否 有 赋值 、 方 法 的 每 条 路 径 旦 否 
都 有 返回 值 、 是 否 所 有 的 受 查 异常 部 被 正确 处 理 了 等 问题 。 编 译 时 期 
的 数据 及 控制 流 分 析 与 类 加 载 时 的 数据 及 控制 流 分 析 的 目的 基本 上 是 
一 致 的 ， 但 校 胜 范围 有 所 区 别 ， 有 一 些 校准 项 只 有 在 编译 期 或 运行 期 


才能 进行 。 下 面 举 一 个 关于 final 修 饰 符 的 数据 及 控制 流 分 析 的 例子 ， 
见 代码 清单 10-1。 


代码 清单 10-1 final 语义 校 验 


// 方 法 一 带 有 final 修 饰 
public void foo (final int arg) { 
final Int var=0; 

//do something 


} 

// 方 法 二 没有 final 修 饰 
public void foo (int arg) { 
int var=0; 

//do something 

} 


在 这 两 个 foo0) 方 法 中 ， 第 一 种 方法 的 参数 和 局 部 变量 定义 使 用 了 
final 修 饰 符 ， 而 第 二 种 方法 则 没有 ， 在 代码 编写 时 程序 肯定 会 受到 
final 修 饰 符 的 影响 ， 不 能 再 改变 arg 和 var 变 量 的 值 ， 但 是 这 两 段 代码 编 
译 出 来 的 Class 文 件 是 没有 任何 一 点 区 别 的 ， 通 过 第 6 章 的 讲解 我 们 已 
经 知道 ， 局 部 变量 与 字段 (实例 变量 、 类 变量 ) 是 有 区 别 的 ， 它 在 常 
量 池 中 没有 CONSTANT _Fieldref info 的 符号 引用 ， 自 然 就 没有 访问 标 
志 (Access_Flags) 的 信息 ， 甚 至 可 能 连 名 称 都 不 会 保留 下 来 (取决 于 
编译 时 的 选项 ) ， 自 然 在 Class 文 件 中 不 可 能 知道 一 个 局 部 变量 是 不 是 
声明 为 final 了 。 因 此 ， 将 局 部 变量 声明 为 final， 对 运行 期 古 没 有 影 啊 
的 ， 变 量 的 不 变性 仅仅 由 编译 右 在 编译 期 间 保障 。 在 Javac 的 源码 中 ， 


数据 及 控制 流 分 析 的 入 口 是 图 10-5 中 的 flow0) 方 法 (对 应 图 10-5 中 的 过 
程 3.2) ， 具 体操 作 由 com.sun.tools.javac.comp.Flow 类 来 完成 。 


3. 解 语法 糖 


语法 糖 (Syntactic Sugar) ， 也 称 糖 衣 语 法 ， 有 是 由 英国 计算 机 科学 
家 彼得 -约翰 : 兰 达 (Peter JLandin) 发 明 的 一 个 术语 ， 指 在 计算 机 语言 
中 添加 的 某 种 语法 ， 这 种 语法 对 语言 的 功能 并 没有 影响 ， 但 是 更 方便 
程序 员 使 用 。 通 前 来 说 ， 使 用 语法 糖 能 够 增加 程序 的 可 读 性 ， 从 而 减 
少 程序 代码 出 错 的 机 会 。 


Java 在 现代 编程 语言 之 中 属于 “低糖 语言 ” (相对 于 C# 及 许多 其 他 
JVM 语 言 来 说 ) ， 尤 其 是 JDK 1.5 之 前 的 版 本 ,“ 低 糖 ?语法 也 是 Java 语 
言 被 怀疑 已 经 “落后 ”的 一 个 表面 理由 。Java 中 最 常用 的 语法 糖 主要 是 
前 面 提 到 过 的 泛 型 ( 沁 型 并 不 一 定 都 是 语法 糖 实 现 ， 如 C# 的 泛 型 就 是 
直接 由 CLR 文 持 的 ) 、 变 长 参数 、 上 自动 装 箱 / 拆 箱 等 ， 虚 拟 机 运行 时 不 
文 持 这 些 语法 ， 它 们 在 编译 阶段 还 原 回 简单 的 基础 语法 结构 ， 这 个 过 
程 称 为 解 语法 糖 。Java 的 这 些 语法 糖 被 解除 后 是 什么 样子， 将 在 10.3 市 
中 详细 讲述 。 


在 Javac 的 源码 中 ， 解 语法 糖 的 过 程 由 desugar() 方 法 触发 ， 在 
com.sun.tools.javac.comp.TransTypes 类 和 com.sun.tools.javac.comp.Lower 


类 中 完成 。 


4. 字 节 码 生成 


字 节 码 生 成 是 Javac 编 译 过 程 的 最 后 一 个 阶段 ， 在 Javac 源 码 里 面 由 
com.sun.tools.javac.jvm.Gen 类 来 完成 。 字 厄 码 生 成 阶段 不 仅仅 是 把 前 
面 各 个 步骤 所 生成 的 信息 (语法 树 、 符 号 表 ) 转化 成 字 节 码 写 到 磁 副 
中 ， 编 译 器 还 进行 了 少量 的 代码 添加 和 转换 工作 。 


例如 ， 前 面 章节 中 多 次 提 到 的 实例 构造 器 <init> (方法 和 类 构造 
器 <dlinit>0 方 法 就 是 在 这 个 阶段 添加 到 语法 树 之 中 的 (注意 ， 这 里 
的 实例 构造 器 并 不 是 指 默认 构造 画 数 ， 如 果 用 户 代 码 中 没有 提供 任何 
构造 函数， 那 编 译 器 将 会 添加 一 个 没有 参数 的 、 访 问 性 (public 、 
protected 或 private) 与 当前 类 一 致 的 默认 构造 钞 数 ， 这 个 工作 在 填充 符 
号 表 阶 段 就 已 经 完成 ) ， 这 两 个 构造 器 的 产生 过 程 实际 上 是 一 个 代码 
收敛 的 过 程 ， 编 译 器 会 把 语句 块 (对 于 实例 构造 器 而 言 是 “{}”* 块 ， 对 
于 类 构造 器 而 言 是 "static{}" 块 ;、 变 量 初始 化 (实例 变量 和 类 变 
量 ) 、 调 用 父 类 的 实例 构造 器 (仅仅 是 实例 构造 器 ，< alinit> 0 方法 
中 无 须 调用 父 类 的 < dlinit>0 方 法， 虚拟 机 会 自动 保证 父 类 构造 器 的 
执行 ， 但 在 <clinit> 0 方法 中 经 常会 生成 调用 java.lang.Object 的 <init 
> () 方 法 的 代码 ) 等 操作 收敛 到 <init> 0 和 <clinit> () 方 法 之 中 ， 并 且 
保证 一 定 是 按 先 执行 父 类 的 实例 构造 器 ， 然 后 初始 化 变量 ， 最 后 执行 
语句 块 的 顺序 进行 ， 上 面 所 述 的 动作 由 Gen.normalizeDefs() 方 法 来 实 
现 。 除 了 生成 构造 器 以 外 ， 还 有 其 他 的 一 些 代码 蔡 换 工作 用 于 优化 程 


序 的 实现 逻辑 ， 如 把 字符 串 的 加 操作 替换 为 StringBuffer 或 StringBuilder 
(取决 于 目标 代码 的 版 本 是 否 大 于 或 等 于 JDK 1.5) 的 append() 操 作 


各 
于 


完成 了 对 语法 树 的 忆 历 和 调整 之 后 ， 束 会 把 填充 了 所 有 所 和 需 信息 
的 符号 表 交 给 com.sun.tools.javac.jvm.ClassWriter 类 ， 由 这 个 类 的 


writeClass() 方 法 输出 字 世 码 ， 生 成 最 终 的 Class 文 件 ， 到 此 为 止 整个 编 


译 过 程 宣告 结束 。 


10.3” Java 语法 糖 的 味道 


几乎 各 种 语言 或 多 或 少 都 捉 供 过 一 些 语 法 糖 来 方便 程序 员 的 代码 
开发 ， 这 些 语法 糖 虽然 不 会 提供 实质 性 的 功能 改进 ， 但 是 它们 或 能 提 
高 效率 ， 或 能 提升 语法 的 严 齐 性， 或 能 减少 编码 出 错 的 机 会 。 不 过 也 
有 一 种 观点 认为 语法 糖 并 不 一 定 都 是 有 益 的 ， 大 量 添 加 和 使 用 " 合 
糖 ” 的 语法 ， 容 易 让 程序 员 产 生 依赖 ， 无 法 看 请 语法 糖 的 糖衣 背后 ， 程 
序 代码 的 真实 面目 。 


总 而 言 之 ， 语 法 糖 可 以 看 做 是 编译 带 实 现 的 一 些 “ 小 把 戏 ”"， 这 
些 “ 小 把 戏 ” 可 能 会 使 得 效率 “大 提升 *， 但 我 们 也 应 该 去 了 解 这 些 “ 小 把 
戏 ” 背 后 的 真实 世界 ， 那 样 才 能 利用 好 它们 ， 而 不 是 被 它们 所 迷惑 。 


10.3.1 泛 型 与 类 型 控 除 


泛 型 是 JDK 1.5 的 一 项 痢 增 特性 ， 它 的 本 质 是 参数 化 类 型 
(Parametersized Type) 的 应 用 ， 也 就 是 说 所 操作 的 数据 类 型 被 指定 为 
一 个 参数 。 这 种 参数 类 型 可 以 用 在 类 、 接 口 和 方法 的 创建 中 ， 分 别称 
为 泛 型 类 、 泛 型 搂 口 和 泛 型 方法 。 


泛 型 思想 早 在 C++ 语言 的 模板 (Template) 中 就 开始 生根 发 芽 ， 在 
Java 语 言 处 于 还 没有 出 现 汉 型 的 版 本 时 ， 只 能 通过 Object 是 所 有 类 型 的 


父 类 和 类 型 强制 转换 两 个 特点 的 配合 来 实现 类 型 泛 化 。 例 如 ， 在 哈 希 
表 的 存 取 中 ，JDK 1.5 之 前 使 用 HashMap 的 get0 方 法 ， 返 回 值 就 是 一 个 
Object 对 象 ， 由 于 Java 语 言 里 面 所 有 的 类 型 都 继承 于 java.lang.Object， 
所 以 Object 转型 成 任何 对 象 都 是 有 可 能 的 。 但 是 也 因为 有 无 限 的 可 能 
性 ， 就 只 有 程序 员 和 运行 期 的 虚拟 机 才 知 道 这 个 Object 到 底 是 个 什么 
类 型 的 对 象 。 在 编译 期 间 ， 编 译 器 无 法 检查 这 个 Object 的 强制 转型 是 
否 成 功 ， 如 果 仅 仅 依赖 程序 员 去 保障 这 项 操作 的 正确 性 ， 许 多 
ClassCastException 的 风险 残 会 转嫁 到 程序 运行 期 之 中 。 


泛 型 技术 在 C# 和 Java 之 中 的 使 用 方式 看 似 相 同 ， 但 实现 上 却 有 着 
根本 性 的 分 歧 ，C# 里 面 泛 型 无 论 在 程序 源码 中 、 编 译 后 的 开 中 
(Intermediate Language， 中 间 语 言 ， 这 时 候 泛 型 是 一 个 占 位 符 ) ， 或 
是 运行 期 的 CLR 中 ， 都 是 切实 存在 的 ，List< int> 与 List< String > 就 
是 两 个 不 同 的 类 型 ， 它 们 在 系统 运行 期 生成 ， 有 上 自己 的 虚 方法 表 和 类 
型 数据 ， 这 种 实现 称 为 类 型 膨胀 ， 基 于 这 种 方法 实现 的 泛 型 称 为 真实 
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Java 语 言 中 的 沁 型 则 不 一 样 ， 它 只 在 程序 源码 中 存在 ， 在 编译 后 
的 字 世 和 码 文件 中 ， 就 已 经 替换 为 原来 的 原生 类 型 (Raw Type， 也 称 为 
裸 类 型 ) 了 ， 并 且 在 相应 的 地 方 插入 了 强制 转型 代码 ， 因 此 ， 对 于 运 


行 期 的 Java 语 言 来 说 ，ArrayList<int> 与 ArrayList< String> 就 是 同一 


个 类 ， 所 以 泛 型 技术 实际 上 是 Java 语 言 的 一 颗 语 法 糖 ，Java 语 言 中 的 
泛 型 实现 方法 称 为 类 型 擦 除 ， 基 于 这 种 方法 实现 的 泛 型 称 为 伪 汉 型 。 


代码 清单 10-2 是 一 段 简单 的 Java 泛 型 的 例 于 ， 我 们 可 以 看 一 下 它 
编译 后 的 结果 是 怎样 的 。 


代码 清单 10-2 ” 泛 型 擦 除 前 的 例子 


public static void main (String[]jargs) { 
Map<String,String>map=new HashMap<String,String>() 
map.put ("hello", "你 好 ") ; 

map.put ("how are you?"," 乃 了 没 ?") ， 
System.out.println (map.get ("hello") ) ; 
System.out.println (map.get ("how are you?") ) ; 


上 


把 这 上 段 Java 代 码 编译 成 Class 文 件 ， 然 后 再 用 字 市 码 反 编译 工具 进 
行 反 编译 后 ， 将 会 发 现 泛 型 都 不 见 了 ， 程 序 又 变 回 了 Java 汉 型 出 现 之 
前 的 写法 ， 泛 型 类 型 都 变 回 了 原生 类 型 ， 如 代码 清单 10-3 所 示 。 


代码 清单 10-3” 泛 型 擦 除 后 的 例子 


public static void main (String[]args) { 

Map map=new HashMap(); 

map.put ("hello",“" 你 好 ") ; 

map.put ("how are you?"，" 吃 了 没 ? ") ， 

System.out.println ( (String) map.get ("hello") ) ; 
System.out.println ( (String) map.get ("how are you?") ) ; 


小 


当初 JDK 设 计 团 队 为 什么 选择 类 型 擦 除 的 方式 来 实现 Java 语 言 的 
泛 型 支持 呢 ? 是 因为 实现 简单 、 兼 容 性 考虑 还 是 别 的 原因 ? 我 们 已 不 
得 而 知 ， 但 确实 有 不 少 人 对 Java 语 言 提 供 的 伪 泛 型 颇 有 微 词 ， 当 时 其 
至 连 《Thinking in Java》 一 书 的 作者 Bruce Eckel 也 发 表 了 一 篇 文章 
《这 不 是 泛 型 ! 》 中 来 批评 JDK 1.5 中 的 泛 型 实现 。 


在 当时 众多 的 批评 之 中 ， 有 一 些 是 比较 表面 的 ， 还 有 一 些 从 性 能 
上 说 泛 型 会 由 于 强制 转型 操作 和 运行 期 缺少 针对 类 型 的 优化 等 从 而 导 
致 比 C# 的 泛 型 慢 一 些 ， 则 是 完全 偏离 了 方向 ， 姑 且 不 论 Java 泛 型 写 不 
征 真 的 会 比 C 旭 了 型 慢 ， 选 择 从 性 能 的 角度 上 评价 用 于 提升 语义 准确 性 
的 沁 型 思想 束 不 太 恰 当 。 但 笔者 也 并 非 在 为 Java 的 泛 型 辩护 ， 它 在 某 
些 场景 下 确实 存在 不 足 ， 笔 者 认为 通过 欣 除 法 来 实现 泛 型 丧失 了 一 些 
泛 型 思想 应 有 的 优雅 ， 例 如 代码 清单 10-4 的 例子 。 


代码 清单 10-4” 当 泛 型 遇见 重 载 1 


public class GenericTypest{ 
public static void method (List<String>1ist) { 
System.out.println ("invoke method (List<Sstring>1ist) ") ; 


public static void method (List<Integer>1ist) { | 
System.out.println ("invoke method (List<Integer>1ist) "); 


请 想 一 想 ， 上 面 这 段 代 码 是 否 正 确 ， 能 否 编译 执行 ? 也 许 你 已 经 
有 了 答案 ， 这 段 代 码 是 不 能 被 编译 的 ， 因 为 参数 List< Integer > 和 List 


<String > 编译 之 后 都 被 控 除 了 ， 变 成 了 一 样 的 原生 类 型 List< 眉 > ， 
擦 除 动作 导致 这 两 种 方法 的 特征 签名 变 得 一 模 一 样 。 初 步 看 来 ， 无 法 
重 载 的 原因 已 经 找到 了 ， 但 真 的 就 是 如 此 吗 ? 只 能 说 ， 泛 型 探 除 成 相 
同 的 原生 类 型 只 是 无 法 重 载 的 其 中 一 部 分 原因 ， 请 再 接着 看 一 看 代码 
清单 10-5 中 的 内 容 。 


代码 清单 10-5” 当 泛 型 遇见 重 载 2 


public class GenericTypest{ 

public static String method (List<String>1ist) { 
System.out.println ("invoke method (List<String>1ist) "); 
return™"; 


public static int method (List<Integer>1ist) { 
System.out.println ("invoke method (List<Integer>1ist) ") ; 
return 1; 

public static void main (String[]args) { 


method (new ArrayList<String>()) ; 
method (new ArrayList<Integer>()):; 


invoke method (List<String>1ist) 
invoke method (List<Integer>1ist) 


代码 请 单 10-5 与 代码 清单 10-4 的 差别 是 两 个 method 方 法 诡 加 了 不 
同 的 返回 值 ， 由 于 这 两 个 返回 值 的 加 入 ， 方 法 重 载 居 然 成 功 了 ， 即 这 


段 代码 可 以 被 编译 和 执行 后 了 。 这 是 对 Java 语 言 中 返回 值 不 参与 重 载 
选择 的 基本 认 知 的 挑战 吗 ? 


代码 清单 10-5 中 的 重 载 当 然 不 是 根据 返回 值 来 确定 的 ， 之 所 以 这 

次 能 编译 和 执行 成 功 ， 是 因为 两 个 method(0 方 法 加 入 了 不 同 的 返回 值 
共存 在 一 个 Class 文 件 之 中 。 第 6 章 介绍 Class 文 件 方法 表 

(method_info) 的 数据 结构 时 曾经 提 到 过 ， 方 法 重 载 要 求 方法 具备 不 
同 的 特征 签名 ,返回 值 并 不 包含 在 方法 的 特征 签名 之 中 ， 所 以 返回 值 
不 参与 重 载 选择 ,但 是 在 Class 文 件 格式 之 中 ， 只 要 搬 述 符 不 是 完全 一 
致 的 两 个 方法 就 可 以 共存 。 也 就 是 说 ， 两 个 方法 如 果 有 相同 的 名 称 和 
特征 签名 ， 但 返回 值 不 同 ， 那 它们 也 是 可 以 合法 地 共存 于 一 个 Class 文 
竹中 


all 
St 
IO 
EE 
N 


由 于 Java 泛 型 的 引入 ， 各 种 场景 (虚拟 机 解析 、 反 射 等 ， 下 的 方 
法 调用 都 可 能 对 原 有 的 基础 产生 影响 和 新 的 需求 ， 如 在 泛 型 类 中 如 何 
获取 传 入 的 参数 化 类 型 等 。 因 此 ，JCP 组 织 对 虚拟 机 规范 做 出 了 相应 
的 修改 ， 引 入 了 诸如 Signature、LocalVariableTypeTable 等 新 的 属性 用 
于 解决 伴随 泛 型 而 来 的 参数 类 型 的 识别 问题 ，Signature 是 其 中 最 重要 
的 一 项 属性 ， 它 的 作用 束 古 存储 一 个 方法 在 字 节 人 码 层 面 的 特征 签名 
3， 这 个 属性 中 保存 的 参数 类 型 并 不 是 原生 类 型 ， 而 是 包括 了 参数 化 
类 型 的 信息 。 修 改 后 的 虚拟 机 规范 由 要 求 所 有 能 识别 49.0 以 上 版 本 的 
Class 文 件 的 虚拟 机 都 要 能 正确 地 识别 Signature 参 数 。 


从 上 面 的 例子 可 以 看 到 的 除法 对 实际 编码 带 来 的 影响 ， 由 于 List 
<String> 和 List< Integer> 擦 除 后 是 同一 个 类 型 ， 我 们 只 能 添加 两 个 
并 不 需要 实际 使 用 到 的 返回 值 才能 完成 重 载 ， 这 是 一 种 宫 无 优雅 和 美 
感 可 言 的 解决 方案 ， 并 且 存 在 一 定语 意 上 的 混乱 ， 辟 如 上 面 脚注 中 提 
到 的 ， 必 须 用 Sun JDK 1.6 的 Javac 才 能 编译 成 功 ， 其 他 版 本 或 者 ECJ 编 
译 右 都 可 能 拒绝 编译 。 


另外 ， 从 Signature 属 性 的 出 现 我 们 还 可 以 得 出 结论 ， 捧 除法 所 谓 
的 探 除 ， 仅 仅 是 对 方法 的 Code 属 性 中 的 字 世 码 进行 探 除 ， 实 际 上 元 数 
据 中 还 古 体 留 了 泛 型 信息 ， 这 也 是 我 们 能 通过 反射 手段 取得 参数 化 类 
型 的 根本 依据 。 


[1] 原文 地 址 : http://www.anyang-window.com.cn/quotthis-is-not-a- 

genericquot-bruce-eckel-eyes-of-the-generic-java/ ° 

[2] 测 试 的 时 候 请 使 用 Sun JDK 1.6 的 Javac 编 译 强 进行 编译 ， 其 他 编译 
， 如 Eclipse JDT 的 ECJ 编 译 器 ， 仍 然 可 能 会 拒绝 编译 这 段 代 码 ，ECJ 

编译 时 会 提示 "Method method 〈List< String > ) has the same erasure 

method (List<E>) as another method in type GenericTypes"。 

[3] 在 《Java 虚 拟 机 规范 〈 第 2 版 ) 》 (JDK 1.5 修 改 后 的 版 本 ) 

的 "$4.4.4 Signatures" 草书 及 《Java 语 言 规范 (第 3 版 ，》 的 "88.4.2 

Method Signature" 章 下 中 分 别 定义 了 字 码 层面 的 方法 特征 签名 ， 以 

及 Java 代 码 层 面 的 方法 特征 签名 ， 特 征 签名 最 重要 的 任务 就 古 作 为 方 


法 独一无二 且 不 可 重复 的 ID， 在 Java 代 码 中 的 方法 特征 签名 只 包括 了 
方法 名 称 、 参 数 顺 序 及 参数 类 型 ， 而 在 字 市 码 中 的 特征 签名 还 包括 方 
法 返回 值 及 受 查 异常 表 ， 本 书 中 如 果 指 的 是 字 世 码 层 面 的 方法 签名 ， 
笔者 会 加 入 限定 语 进行 说 明 ， 也 请 读者 根据 上 下 文 语 境 注 意 区 分 。 
MIJDK 15 对 虚拟 机 规范 修 改 


http://jcp.org/aboutJava/communityprocess/maintenance/jsr 


924/index.html ° 


10.3.2 ”自动 装 种 


` 拆 炸 与 过 历 循 环 


从 纯 技 术 的 角度 来 讲 ， 目 动 装 箱 、 上 自动 拆 箱 与 遍历 循环 (Foreach 
循环 ) 这 些 语法 糖 ， 无 论 是 实现 上 还 是 思想 上 都 不 能 和 上 文 介绍 的 泛 
型 相 比 ， 两 者 的 难度 和 深度 都 有 很 大 有 差距。 专门 拿 出 一 节 来 讲解 它们 

只 有 一 个 理由 : 这 无 疑问 ， 它 们 是 Java 语 言 里 使 用 得 最 多 的 语法 糖 。 
我 们 通过 代码 清单 10-6 和 代码 清单 10-7 中 所 示 的 代码 来 看 看 这 些 语 法 
糖 在 编译 后 会 发 生 什么 样 的 变化 。 


代码 请 单 10-6” 目 动 痛 箱 、 拆 箱 与 过 有 历 循环 


public static void main (String[]jargs) { 
List<Integer>1ist=Arrays.asList (1, 2, 3, 4); 


// 如 果 在 JDK 1.7 中 ， 还 有 另外 一 颗 语 法 糖 L1] 


// 能 让 上 


看 这 人 句 代码 进 


int sum=0; 


for (int i:list) { 


sum+=i; 


步 简 写成 List<Integer>1list=[1, 2, 3, 4]; 


System.out.println (sum) ; 


代码 清单 10-7” 目 动 痛 箱 、 拆 箱 与 过 有 历 循环 编译 之 后 


public static void main (String[]args) { 
List list=Arrays.asList (new Integer[]{ 
Integer.valueof (1) ， 


Integer .valueof (2 


Integer .valueof (3 
Integer .valueof (4 
int sum=0; 


J 
J 
) 


) 


for (Iterator localIterator=list.iterator(); 
localIterator ,hasNext(); ) { 

int i= ( (Integer) LocalIterator .next()) .intValue(); 

SUM+=1i; 


System,out.println (sum) ; 


代码 清单 10-6 中 一 共 包 含 了 泛 型 、 自 动 装 箱 、 自 动 拆 箱 、 人 遍历 入 
环 与 变 长 参数 5 种 语法 糖 ， 代 码 清 单 10-7 则 展示 了 它们 在 编译 后 的 变 
化 。 泛 型 就 不 必 说 了 ， 目 动 装 箱 、 拆 箱 在 编译 之 后 说 转化 成 了 对 应 的 
包装 和 还 原 方法 ， 如 本 例 中 的 IntegervalueOfO 与 IntegerintValue() 方 
法 ， 而 侦 历 循环 则 把 代码 还 原 成 了 送 代 器 的 实现 ， 这 也 是 为 何 遍 历 循 
环 需要 被 遍历 的 类 实现 Iterable 接 口 的 原因 。 最 后 再 看 看 变 长 参数 ， 它 
在 调用 的 时 候 变 成 了 一 个 数组 类 型 的 参数 ， 在 变 长 参数 出 现 之 前 ， 程 
序 员 就 是 使 用 数组 来 完成 类 似 功能 的 。 


这 些 语法 糖 虽然 看 起 来 很 简 单 ， 但 也 不 见得 束 没 有 任何 值得 我 们 
注意 的 地 方 ， 代 码 清单 10-8 演 示 了 目 动 狼 箱 的 一 些 错误 用 法 。 


代码 清单 10-8 ”自动 装 箱 的 陷阱 


public static void main (String[]args) { 
Integer a=1; 

Integer 
Integer 
Integer 
Integer 
Integer f=321.; 
Long g=3L; 
System.out.println (c==d) ; 
System.out.println (e==f) ; 


OOON 


moo5ro 
D 
gy 


System.out,println (c== (a+b) ) ; 
System.out.println (c.equals (a+b) ) ; 
System.out.println (g== (at+b) ) ; 
System.out.println (g.equals (a+b) ); 
} 


阅读 完 代 码 请 单 10-8， 读 者 不 妨 思 考 两 个 问题 : 一 是 这 6 名 打印 语 
句 的 输出 是 什么 ? 二 是 这 6 句 打 印 语句 中 ， 解 除 语法 糖 后 参数 会 是 什么 
样子 ?这 两 个 问题 的 答案 可 以 很 容易 试验 出 来 ， 笔 者 束 和 暂且 略 去 管 
案 , 布 望 读者 目 己 上 机 实践 一 下 。 无 论 读者 的 回答 是 否 正 确 ， 鉴 于 包 
痛 类 的 “==” 运 算 在 不 遇 到 算术 运算 的 情况 下 不 会 目 动 拆 箱 ， 以 及 它们 
equals() 方 法 不 处 理 数 据 转型 的 关系 ， 笔 者 建议 在 实际 编码 中 尽量 避免 
这 样 使 用 目 动 痛 箱 与 拆 箱 。 


[1 在 本 章 完 稿 之 后 ， 此 语法 糖 随 着 Project Coin 一 起 被 划分 到 JDK 1.8 中 
了 ， 在 JDK 1.7 里 不 会 包括 。 


10.3.3 条件 编 译 


许多 程序 设计 语言 都 提供 了 条 件 编译 的 途径 ， 如 C、C++ 中 使 用 预 

处 理 器 指示 符 (##fdef) 来 完成 条 件 编 译 。C、C++ 的 预 处 理 器 最 初 的 
任务 是 解决 编译 时 的 代码 依赖 关系 (如 非常 党 用 的 #include 预 处 理 命 
令 ) ， 而 在 Java 语 言 之 中 并 没有 使 用 预 处 理 器 ， 因 为 Java 语 言 天 然 的 
编译 方式 (编译 器 并 非 一 个 个 地 编译 Java 文 件 ， 而 是 将 所 有 编译 单元 
的 语法 树 顶 级 节点 输入 到 待 处理 列表 后 再 进行 编译 ， 因 此 各 个 文件 之 
间 能 够 互相 提供 符号 信息 ) 无 须 使 用 预 处 理 历 。 那 Java 语 言 是 否 有 办 
法 实现 条 件 编 译 呢 ? 


Java 语 言 当 然 也 可 以 进行 条 件 编 译 ， 方 法 就 是 使 用 条 件 为 常量 的 if 
语句 。 如 代码 清单 10-9 所 示 ， 此 代码 中 的 站 语句 不 同 于 其 他 Java 代 码 ， 
它 在 编译 阶段 就 会 被 “运行 "， 生 成 的 字 节 码 之 中 只 包 
括 "System.out.println ("block 1") ; "一 条 语句 ， 并 不 会 包含 和 ff 语句 及 


另外 一 个 分 子 中 的 "System.out.println ("block 2") ;" 
代码 清单 10-9 Java 语言 的 条 件 编译 


public static void main (String[]args) { 
if (true) { 

System.out.println ("block 1") ; 

}elsef{ 

System.out.println ("block 2") ; 

} 


上 述 代码 编译 后 Class 文 件 的 反 编 译 结果 : 


public static void main (String[]args) { 
System.out.println ("block 1") ; 


只 能 使 用 条 件 为 营 量 的 if 语句 才能 达到 上 述 效果 ， 如 采 使 用 币 量 
与 其 他 之 有 条 件 判断 能 力 的 语句 搭配 ， 则 可 能 在 控制 流 分 析 中 提示 错 
误 ， 被 拒绝 编译 ， 如 代码 清单 10-10 所 示 的 代码 就 会 被 编译 器 拒绝 编 
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代码 清单 10-10 不 能 使 用 其 他 条 件 语句 来 完成 条 件 编译 


public static void main (String[]args) { 
// 编 译 器 将 会 提示 "Unreachable code" 

while (false) { 

System.out.println ("") ; 


} 


Java 语 言 中 条 件 编译 的 实现 ， 也 是 Java 语 言 的 一 颗 语 法 糖 ， 根 据 
布尔 常量 值 的 真 假 ， 编 译 器 将 会 把 分 文中 不 成 立 的 代码 块 消除 掉 ， 这 
一 工作 将 在 编译 器 解除 语法 糖 阶段 (com.sun.tools.javac.comp.Lower 类 
中 ) 完成 。 由 于 这 种 条 件 编译 的 实现 方式 使 用 了 if 语句 ， 所 以 它 必 须 
遵循 最 基本 的 Java 语 法 ， 只 能 写 在 方法 体内 部 ， 因 此 它 只 能 实现 语句 


基本 块 (Block) 级 别 的 条 件 编 译 ， 而 没有 办 法 实现 根据 条 件 调整 整个 
Java 类 的 结构 。 


除了 本 世 中 介绍 的 泛 型 、 目 动 痛 箱 、 目 动 拆 箱 、 允 历 循环 、 变 长 
参数 和 条 件 编 译 之 外 ，Java 语 言 还 有 不 少 其 他 的 语法 糖 ， 如 内 部 类 、 
枚 举 类 、 断 言语 句 、 对 枚 举 和 字符 串 (在 JDK 1.7 中 支持 ) 的 switch 文 
持 、try 语 句 中 定义 和 关闭 资源 (在 JDK 1.7 中 支持 ) 等 ， 读 者 可 以 通过 
跟踪 Javac 源 码 、 反 编译 Class 文 件 等 方式 了 解 它 们 的 本 质 实现 ， 转 于 篇 
虽 ， 笔 者 驶 不 再 一 一 介绍 了 。 


10.4 实战， 插入 式 注 解 处 理 絮 


JDK 编 译 优 化 部 分 在 本 书 中 并 没有 设置 独立 的 实战 章节 ， 因 为 我 
们 开发 程序 ， 考 虑 的 主要 是 程序 会 如 何 运行 ， 很 少 会 有 针对 程序 编译 
的 需求 。 也 因为 这 个 原因 ， 在 JDK 的 编译 子 系统 里 面 ， 提 供给 用 户 直 
接 控制 的 功能 相对 较 少 ， 除 了 第 11 章 会 介绍 的 虚拟 机 JIT 编 译 的 几 个 相 
关 参 数 以 外 ， 我 们 就 只 有 使 用 JSR-296 中 定义 的 插入 式 注解 处 理 器 API 
来 对 JDK 编 译 子 系统 的 行为 产生 一 些 影响 。 


但 是 笔者 并 不 认为 相对 于 前 两 部 分 介绍 的 内 存 管 理子 系统 和 字 闻 
码 执行 子 系统 ，JDK 的 编译 子 系统 束 不 那么 重要 。 一 套 编程 语言 中 编 
译 子 系统 的 优 务 ， 很 大 程度 上 决定 了 程序 运行 性 能 的 好 坏 和 编码 效率 
的 高 低 ， 尤 其 在 Java 语 言 中 ， 运 行 期 即时 编译 与 虚拟 机 执行 子 系统 非 
常 紧 密 地 互相 依赖 、 配 合 运 作 (第 11 革 将 主要 讲解 这 方面 的 内 容 ) 。 
了 解 JDK 如 何 编 译 和 优化 代码 ， 有 助 于 我 们 写 出 适合 JDK 目 优化 的 程 
序 。 下 面 我 们 回 到 本 章 的 实战 中 ， 看 看 插入 式 注解 处 理 右 API 能 实现 
什么 功能 。 


10.4.1 ”实战 目标 


通过 阅读 Javac 编 译 占 的 源码 ， 我 们 知道 编译 右 在 把 Java 程 序 源码 
编译 为 子 节 码 的 时 候 ， 会 对 Java 程 序 源码 做 各 方面 的 检查 校 验 。 这 些 
校 验 主要 以 程序 * 写 得 对 不 对 ?为 出 发 点 ， 虽 然 也 有 各 种 WARNING 的 
信息 ， 但 总 体 来 讲 还 是 较 少 去 校 验 程 序 * 写 得 好 不 好 ?”。 有 鉴于 此 ， 业 
界 出 现 了 许多 针对 程序 “ 写 得 好 不 好 ”的 辅助 校 验 工 具 ， 如 CheckStyle 、 
FindBug、Klocwork 等 。 这 些 代码 校 验 工 具有 一 些 是 基于 Java 的 源码 进 
行 校 验 ， 还 有 一 些 是 通过 扫描 字 市 码 来 完成 ， 在 本 广 的 实战 中 ， 我 们 
将 会 使 用 注解 处 理 右 API 来 编写 一 款 拥 有 目 己 编码 风格 的 校 验 工 具 : 


NameCheckProcessor ° 


当然 ， 由 于 我 们 的 实战 都 是 为 了 学 习 和 演示 技术 原理 ， 而 不 是 为 
了 做 出 一 款 能 媲美 CheckStyle 等 工具 的 产品 来 ， 所 以 
NameCheckProcessor 的 目标 也 仅 定 为 对 Java 程 序 命名 进行 检查 ， 根 据 
《Java 语 言 规范 〈 第 3 版 ) 》 中 第 6.8 节 的 要 求 ，Java 程 序 命名 应 当 符 合 
下 列 格式 的 书写 规范 。 


类 (或 接口 : 符合 纶 式 命名 法 ， 首 字母 大 写 。 


方法 : 符合 疙 式 命 名 法 ， 首 字母 小 写 。 


。 类 或 实例 变量 ， 符 合 驼 式 命名 法 ， 首 字母 小 写 。 


。 常 量 ， 要 求全 部 由 大 写字 母 或 下 划 线 构成 ， 并 且 第 一 个 字符 不 
能 是 下 划 线 。 


上 文 提 到 的 驼 式 命名 法 (Camel Case Name) ， 正 如 它 的 名 称 所 表 
示 的 那样 ， 古 指 混 合 使 用 大 小 写字 母 来 分 割 构成 变量 或 钞 数 的 名 字 ， 
犹如 纶 峰 一 般 ， 这 是 当前 Java 语 言 中 主流 的 命名 规范 ， 我 们 的 实战 目 
标 束 是 为 Javac 编 译 亏 添加 一 个 额外 的 功能 ， 在 编译 程序 时 检查 程序 名 
是 否 符合 上 述 对 类 《或 接口 ) 、 方 法 、 字 段 的 命名 要 求 赔 。 


[在 JDK 的 sample/javac/processing 目 录 中 有 这 次 实战 的 源码 (稍微 复 
杂 一 些 ,， 但 总 体 上 差距 不 大 ) ， 读 者 可 以 阅读 参考 。 


10.4.2 ”代码 实现 


要 通过 注解 处 理 器 API 实 现 一 个 编译 器 插件 ， 首 移 需 要 了 解 这 组 
API 的 一 些 基本 知识 。 我 们 实现 注解 处 理 絮 的 代码 需要 继承 抽象 类 
javax.annotation.processing.AbstractProcessor， 这 个 抽象 类 中 只 有 一 个 
必须 履 盖 的 abstract 方 法 : "process0"， 它 是 Javac 编 译 器 在 执行 注解 处 
理 强 代码 时 要 调用 的 过 程 ， 我 们 可 以 从 这 个 方法 的 第 一 个 参 
数 "annotations" 中 获取 到 此 注解 处 理 器 所 要 处 理 的 注解 集合 ， 从 第 二 个 
参数 "roundEnv" 中 访问 到 当前 这 个 Round 中 的 语法 树 节 点 ， 每 个 语法 树 
节点 在 这 里 表示 为 一 个 Element。 在 JDK 1.6 新 增 的 javax.lang.model 包 
中 定义 了 16 类 Element， 包 括 了 Java 代 码 中 最 常用 的 元 素 ， 如 : “ 包 

(PACKAGE) 、 枚 举 (ENUM) 、 类 (CLASS) 、 注 解 
(ANNOTATION_TYPE) 、 接 口 (INTERFACE) 、 枚 举 值 
(ENUM_CONSTANT) 、 字 段 (FIELD) 、 参 数 (PARAMETER) 
本 地 变量 (LOCAL _VARIABLE) 、 异 常 
(EXCEPTION_PARAMETER) 、 方 法 (METHOD) 、 构 造 贸 数 
(CONSTRUCTOR) 、 静 态 语句 块 (STATIC_INIT， 即 static{} 块 ) 
实例 语句 块 (INSTANCE_INIT， 即 人 } 块 )、 参 数 化 类 型 
(TYPE_PARAMETER， 既 泛 型 尖 括 号 内 的 类 型 ) 和 未 定义 的 其 他 语 
法 树 节 点 (OTHER) ”。 除 了 process() 方 法 的 传 入 参数 之 外 ， 还 有 一 个 


很 常用 的 实例 变量 "processingEnv"， 它 是 AbstractProcessor 中 的 一 个 
protected 变 量 ， 在 注解 处 理 器 初始 化 的 时 候 (init0 方 法 执行 的 时 候 ) 
创建 ， 继 承 了 AbstractProcessor 的 注解 处 理 器 代码 可 以 直接 访问 到 它 。 
它 代 表 了 注解 处 理 器 框架 提供 的 一 个 上 下 文 环 境 ， 要 创建 新 的 代码 、 
向 编译 器 输出 信息 、 获 取 其 他 工具 类 等 都 需要 用 到 这 个 实例 变量 。 


注解 处 理 絮 除了 process() 方 法 及 其 参数 之 外 ， 还 有 两 个 可 以 配合 
使 用 的 Annotations:@SupportedAnnotationTypes 和 
@SupportedSourceVersion， 前 者 代表 了 这 个 注解 处 理 絮 对 哪些 注解 感 
兴趣 ， 可 以 使 用 星 号 “*” 作 为 通配符 代表 对 所 有 的 注解 都 感 兴趣 ， 后 者 
指出 这 个 注解 处 理 器 可 以 处 理 哪些 版 本 的 Java 代 码 。 


每 一 个 注解 处 理 器 在 运行 的 时 候 都 是 单 例 的 ， 如 果 不 需 要 改变 或 
生成 语法 树 的 内 容 ，process() 方 法 就 可 以 返回 一 个 值 为 false 的 布尔 
值 ， 通 知 编译 侣 这 个 Round 中 的 代码 未 发 生变 化 ， 无 须 构造 新 的 
JavaCompiler 实 例 ， 在 这 次 实战 的 注解 处 理 器 中 只 对 程序 命名 进行 检 
查 ， 不 需要 改变 语法 树 的 内 容 ， 因 此 process() 方 法 的 返回 值 都 是 
false。 关 于 注解 处 理 器 的 API， 笔 者 就 简单 介绍 这 些 ， 对 这 个 领域 有 兴 
趣 的 读者 可 以 阅读 相关 的 帮助 文档 。 下 面 来 看 看 注解 处 理 咒 
NameCheckProcessor 的 具体 代码 ， 如 代码 清单 10-11 所 示 。 


代码 清单 10-11 注解 处 理 器 NameCheckProcessor 


// 可 以 用 "*" 表 示 文 持 所 有 Annotations 
@SupportedAnnotationTypes ("*") 
// 只 支持 JDK 1.6 的 Java 代 码 

@SupportedSourceVersion (Sourceversion,RELEASE_6) 

public class NameCheckProcessor extends AbstractProcessort{ 
private NameChecker nameChecker.; 

De 

* 初 始 化 名 称 检查 插件 
*/ 

Q@Override 

public void init (ProcessingEnvironment processingEnv) { 
super.init (processingEnv) ; 

nameChecker=new NameChecker (processingEnv) ; 


} 

pA 

* 对 输入 的 语法 树 的 各 个 节点 进行 名 称 检查 
YX 

Q@Override 


public boolean process (Set<?extends TypeElement> 
annotations,RoundEnvironment roundEnv) { 

if (!roundEnv.processingOver()) { 

for (Element element:roundEnv.getRootElements()) 

nameChecker .checkNames (element) ; 


} 


return false; 


} 
} 


从 上 面 代码 可 以 看 出 ，NameCheckProcessor 能 处 理 基 于 JDK 1.6 的 
源码 ， 它 不 限于 特定 的 注解 ， 对 任何 代码 都 “ 感 兴趣 ”， 而 在 process0) 
方法 中 是 把 当前 Round 中 的 每 一 个 RootElement 传 递 到 一 个 名 为 


NameChecker 的 检查 器 中 执行 名 称 检查 逻辑 ，NameChecker 的 代码 如 代 
码 清 单 10-12 所 示 。 


代码 清单 10-12 ”命名 检查 器 NameChecker 


/A** 
* 程 序 名 称 规范 的 编译 器 插件 :<br> 


* 如 果 程 厚 命 名 不 合 规范 ， 将 会 输出 一 个 编 诺 售 的 WARNING 信 息 
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public class NameCheckert{ 

private final Messager messager:; 

NameCheckScanner nameCheckScanner=new NameCheckScanner(); 

NameChecker (ProcessingEnvironment processsingEnv) { 

this.messager=processsingEnv.getMessager(); 

} 

pea 

* 对 Java 程 序 命名 进行 检查 ， 根 据 《Java 语 言 规 范 (第 3 版 》 第 6 .8 节 的 要 求 ，Java 
程序 命名 应 当 符合 下 列 格式 : 

* 


*<Ul> 
*<1i > 类 或 接口 : 符合 弦 式 命名 法 ， 首 字母 大 写 。 

*<1i> 方 法 : 符合 驼 式 命名 法 ， 首 字母 小 写 。 

* < 之 1i> 字 上段: 

*<Ul> 

*<1> 类 、 实 例 变 量 : 符合 驼 式 命名 法 ， 首 字母 小 写 。 

*<1i 常 量 : 要 求全 部 大 写 。 

*</ul> 

“< /UL 

*{ 

public void checkNames (Element element) { 
nameCheckScanner .scan (element) ; 

} 

As 

* 名 称 检查 器 实现 类 ， 继 承 了 JDK 1.6 中 新 提供 的 ElementScanner6<br> 
* 将 会 以 Visitor 模 式 访问 抽象 语法 树 中 的 元 素 


4 

private class NameCheckScanner extends ElementScanner6< 
Void,Void>f{ 

J/ * 

* 此 方法 用 于 检查 Java 类 

$y 

Q@Override 


public Void visitType (TypeElement e,Void p) { 
scan (e.getTypeParameters(), p); 
checkCamelCase (e,true) ; 

super .visitType (e,p) ; 

return null; 


} 

pA * 

* 检 查 方 法 命名 是 否 合法 
WA 

Q@Override 


public Void visitExecutable (ExecutableElement e,Void p) { 
if (e.getkind()==METHOD) { 
Name name=e.getSimpleName(); 


bl 


查 


if 
(name.contentEquals (e.getEnclosingElement().getSimpleName()) ) 
messager .printMessage (WARNING，" 一 个 普通 方法 ""+name+"" 不 应 当 与 类 名 重 
避免 与 构造 本 数 产生 混淆 "，e) ; 
checkCamelCase 人 
} 
super .visitExecutable (e,p) ; 
return null; 


pA 

* 检 查 变量 命名 是 否 合 法 
yA 

Q@Override 


public Void visitVariable (VariableElement e,Void p) { 
// 如 果 这 个 Variable 是 枚 举 或 常量 ， 则 按 大写 命 名 检查 ， 否 则 按照 驼 式 命名 法 规则 检 


if 


(e.getkind()==ENUM_CONSTANT| |e.getconstantValue()!=null||heuristica 
llyConstant (e) ) 


checkAllcaps (e) ; 

else 

checkCamelCase (e,false) ; 

return null; 

} 

/A 

* 判 断 一 个 变量 是 否 是 常量 

4 

private boolean heuristicallyConstant (VariableElement e) { 
if (e.getEnclosingElement().getkind()==INTERFACE) 

return true; 

else if (e.getkind()==FIELD&&e.getModifiers().containsAll 


(EnumSet ,of (PUBLIC,STATIC, FINAL) ) ) 


return true; 
elset{ 
return false; 


} 

} 

ye 

* 检 查 传 入 的 Element 是 否 符合 驼 式 命名 法 ， 如 果 不 符合 ， 则 输出 警告 信息 
*/ 

private void checkCamelCase (Element e,boolean initialCaps) { 
String name=e.getSimpleName().toString(); 

boolean previousUpper=false.; 

boolean conventional=true; 

int firstCodePoint=name.codePointAt (0) ; 

if (Character .isUpperCase (firstCodePoint) ) { 
previousUpper=true:; 

if (LinitialCaps) { 


messager.printMessage (WARNING，" 和 名 称 ""+name+" "应 当 以 小 写字 母 开 头 "， 
e) ; 
return; 


}else if (Character.isLowerCase (firstCodePoint) ) { 

if (initialCaps) { 

messager.printMessage (WARNING， "名称 ""+name+"" 应 当 以 大 写字 和 母 开头 "， 
e) ; 


return; 

}else 

conventional=false; 

if (conventional) { 

int cp=firstCodePoint; 

for (int i=Character.charCount (cp) ; i<name.length(); 
i+=Character.charCount (cp) ) { 

cp=name.codePointAt (i); 

if (Character.isUpperCase (cp) ) { 

if (previousUpper) { 

conventional=false; 

break; 

了 二 

previousUpper=true; 

}else 

previousUpper=false:; 

} 

} 


if (!conventional) 
messager .printMessage (WARNING," 名 称 ""+name+"" 应 当 符合 驼 式 命名 法 
(Camel Case Names) ", e); 

} 

* 大 写 命名 检查 ， 要 求 第 一 个 字母 必须 是 大 写 的 英文 字母 ， 其 余部 分 可 以 是 下 划 线 或 大 写 
字母 

*/ 

private void checkAllCcaps (Element e) { 

String name=e.getSimpleName().toString(); 

boolean conventional=true; 

int firstCodePoint=name.codePointAt (0) ; 

if (!Character.isUpperCase (firstCodePoint) ) 

conventional=false; 

elsef{ 

boolean previousUnderscore=false.; 

int cp=firstCodePoint; 

for (int i=Character.charCount (cp) ; i<name.length(); 
i+=Character.charCount (cp) ) { 

cp=name .codePointAt (i); 

if (cp== (int) '_') { 


if (previousUnderscore) { 
conventional=false:; 
break; 

} 
previousUnderscore=true; 
}elsef{ 
previousUnderscore=false.; 
if (!Character.isUpperCase (cp) 区 区 !Character ,isDigit (cp) ) 
{ 

conventional=false; 
break; 

} 

} 

} 


if (!conventional) 
messager .printMessage (WARNING," 常 量 ""+name+"" 应 当 全 部 以 大 写字 母 或 下 
划 线 命名 ， 并 且 以 字母 开头 "，e) 


} 
} 
} 


NameChecker 的 代码 看 起 来 有 点 长 ， 但 实际 上 注释 占 了 很 大 一 部 
分 ， 其 实 即使 算 上 注释 也 不 到 190 行 。 它 通过 一 个 继承 于 
javax.lang.model.util.ElementScanner6 的 NameCheckScanner 类 ， 以 
Visitor 模 式 来 完成 对 语法 树 的 过 历 ， 分 别 执行 visitTypeO、 
visitVariable0 和 visitExecutable() 方 法 来 访问 类 、 字 段 和 方法 ， 这 3 个 
visit 方 法 对 各 目的 命名 规则 做 相应 的 检查 ，checkCamelCase() 与 
checkAllCaps(0) 方 法 则 用 于 实现 驼 式 命名 法 和 全 大 写 命 名 规则 的 检查 。 


整个 注解 处 理 器 只 需 NameCheckProcessor 和 NameChecker 两 个 类 
就 可 以 全 部 完成 ,为 了 验证 我 们 的 实战 成 果 ， 代 码 清 单 10-13 中 提供 了 
一 段 命名 规范 的 “反面 教材 ”代码 ， 其 中 的 每 一 个 类 、 方 法 及 字段 的 命 


名 都 存在 问题 ， 但 是 使 用 普通 的 Javac 编 译 这 段 代 码 时 不 会 提示 任何 


个 Warning 信 息 。 
代码 清单 10-13 ”包含 了 多 处 不 规范 命名 的 代码 样 例 


public class BADLY_ NAMED CODET{ 

enum colorst{ 

red, blue, green.; 

} 

static final int_FORTY_TWO=42; 

public static int NOT_A CONSTANT=_FORTY_TWO; 
protected void BADLY_NAMED_CODE( ){ 

returni 


} 

public void NOTcamelCASEmethodNAME( ){ 
returni 

} 

} 


10.4.3 ”运行 与 测试 


我 们 可 以 通过 Javac 命 令 的 "-processor" 参 数 来 执行 编译 时 需要 附带 
的 注解 处 理 器 ， 如 果 有 多 个 注解 处 理 器 的 话 ， 用 逗号 分 隔 。 还 可 以 使 
用 -XprintRounds 和 -XprintProcessorInfo 参 数 来 查看 注解 处 理 器 运作 的 详 
细 信 息 ， 本 次 实战 中 的 NameCheckProcessor 的 编译 及 执行 过 程 如 代码 
清单 10-14 所 示 。 


代码 清单 10-14 ”注解 处 理 絮 的 运行 过 程 


D:\src>javac org/fenixsoft/compile/NameChecker .java 

D:\src>javac org/fenixsoft/compile/NameCheckProcessor.]java 

D:\src>javac-processor org.fenixsoft.compile.NameCheckProcessor 
org/fenixsoft/compile/BADLY_NAMED_CODE. java 

org\fenixsoft\compile\BADLY_NAMED_CODE.java:3: 警 告 : 名 
称 "BADLY_NAMED_CODE" 应 当 符合 驼 式 命 名 法 (Camel Case Name 

public class BADLY_NAMED_ CODET{ 

八 

org\fenrx Sort\compi le\BADEY. NAMED_CODE. java:5: 
当 以 大 写字 母 


enum colorst{ 
八 


Vv 


路 
EF 


告 :名 称 "colors"y 


org\fenixsoft\compile\BADLY NAMED_CODE . java:6 :警告 :常量 "red" 应 当 全 
部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 

red, blue, green; 

八 

orgNfenixsoftNcompilLeNxBADLY_NAMED_CODE. java:6: 和 警告 :常量 "bpLue" 应 当 

全 部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 开头 

red, blue, green; 

八 

org\fenixsoft\compile\BADLY_ NAMED CODE. java:6: 警 告 :常量 "green" 应 当 


全 部 以 大 写字 母 或 下 划 线 命名 ， 并 且 以 字母 
red, blue, green; 
八 


orgNfenixsoftNcompileXxBADLY_NAMED_CODE. java:9 :和 警 

量 "_FORTY_TWO" 应 当 全 部 以 大 写字 母 或 下 划 线 命名 ， 并 

static final int_FORTY_TWO=42 
八 


Ee 


过, 这 百 . 肌 
并 且 以 字母 


头 
org\fenixsoftt compile\BADLY NAMED_CODE .java:11: 警 告 :名 
称 "NOT_A_CONSTANT" 应 当 以 小 写字 母 开头 
public static int NOT_A CONSTANT=_FORTY_TWO 
八 
以 小 写字 母 开头 


org\Ten Yoot teomp Le\BADLY NAMED_CODE .java:13: 
protected void Test(){ 
八 


虹 


警告 :名 称 "Test" 应 当 


称 "'NOTcamelCASEmethodNAME" 应 当 以 小 写字 和 母 
八 


org\fenixsoft\compile\BADLY_NAMED_ CODE. java:17: 


类 


路 


nk 
I 


public void NOTcamelCASEmethodNAME( ){ 


10.4.4 其 他 应 用 案例 


NameCheckProcessor 的 实战 例子 只 演示 了 JSR-269 藤 入 式 注 解 处 理 
器 API 中 的 一 部 分 功能 ， 基 于 这 组 API 文 持 的 项 目 还 有 用 于 校 验 
Hibernate 标 签 使 用 正确 性 的 Hibernate Validator Annotation Processorl1] 
(本 质 上 与 NameCheckProcessor 所 做 的 事情 差不多 ) 、 目 动 为 字段 生 
成 getter 和 setter 方 法 的 Project LombokL”| (根据 已 有 元 素 生 成 新 的 语法 
树 元 素 ) 等 ， 读 者 有 兴趣 的 话 可 以 参考 它们 官方 站 点 的 相关 内 容 。 


[1] 官 方 站 点 : http://www.hibernate.org/subprojects/validator.html 。 


[2] 官 方 站 点 : http://projectlombok.org/。 


10.5 ”本草 小 结 


在 本 章 中 ， 我 们 从 编译 釉 源 码 实现 的 层次 上 了 解 了 Java 源 代码 编 
译 为 字 节 码 的 过 程 ， 分 析 了 Java 语 言 中 沁 型 、 主 动 闭 箱 / 拆 箱 、 条 件 纺 
对 等 多 种 语法 糖 的 前 因 后 果 ， 并 实战 练习 了 如 何 使 用 插入 陈 注 解 处 理 
堪 来 完成 一 个 检查 程序 命名 规范 的 编译 亏 插 件 。 如 本 草 概述 中 所 说 的 
那样 ， 在 前 端 编译 大 中 , “优化 "手段 主要 用 于 提升 程序 的 编码 效率 ， 
之 所 以 把 Javac 这 类 将 Java 代 人 码 转 变 为 字 世 码 的 编译 需 称 做 “前 端 编译 
万 ”， 征 因为 它 只 完成 了 从 程序 到 抽象 语法 树 或 中 间 字 节 码 的 生成 ， 而 
在 此 之 后 ， 还 有 一 组 内 置 于 虚拟 机 内 部 的 “后 端 编译 万 ?完成 了 从 字 闻 
码 生 成 本 地 机 器 码 的 过 程 ， 即 前 面 多 次 提 到 的 即时 编译 出 或 IT 编 译 
器 ， 这 个 编译 器 的 编译 速度 及 编译 结果 的 优 务 ， 是 衡量 虚拟 机 性 能 一 
个 很 重要 的 指标 。 在 第 11 章 中 ， 我 们 将 会 介绍 即时 编译 万 的 运作 和 优 
化 过 程 。 


入 


第 11 章 ”晚期 (运行 期 ) 优化 


从 计算 机 程序 出 现 的 第 一 天 起 ， 对 效率 的 追求 束 是 程序 天 生 的 坚 
定 信仰 ， 这 个 过 程 狼 如 一 场 没 有 终点 、 永 不 售 鞭 的 F1 方 程式 竞赛 ， 程 
序 员 是 车 手 ， 技 术 平 台 则 是 在 赛 道 上 飞驰 的 赛车 。 


11.1 概述 


在 部 分 的 商用 虚拟 机 (Sun HotSpot、IBM J9) 中 ，Java 程 序 最 初 
是 通过 解释 器 (Interpreter) 进行 解释 执行 的 ， 当 虚拟 机 发 现 某 个 方法 
或 代码 块 的 运行 特别 频繁 时 ， 就 会 把 这 些 代码 认定 为 “热点 代码 ” (Hot 
Spot Code) 。 为 了 提高 热点 代码 的 执行 效率 ， 在 运行 时 ， 虚 拟 机 将 会 
把 这 些 代码 编译 成 与 本 地 平台 相关 的 机 器 码 ， 并 进行 各 种 层次 的 优 
化 ， 完 成 这 个 任务 的 编译 器 称 为 即时 编译 器 (Just In Time Compiler， 
下 文中 简称 JIT 编 译 器 ) 。 


即时 编译 右 并 不 古 虚 拟 机 必需 的 部 分 ，Java 虚 拟 机 规范 并 没有 规 
定 Java 庶 拟 机 内 必须 要 有 即时 编译 万 存在 ， 更 没有 限定 或 指导 即时 编 
译 姻 应 该 如 何 去 实 现 。 但 古 ， 即 时 编译 右 编 译 性 能 的 好 坏 、 代 码 优化 
程度 的 高 低 却 是 衡量 一 球 商 用 虚拟 机 优秀 与 否 的 最 关键 的 指标 之 一 ， 


它 也 是 虚拟 机 中 最 核心 且 最 能 体现 虚拟 机 技术 水 平 的 部 分 。 在 本 章 
中 ， 我 们 将 走 进 虚 拟 机 的 内 部 ， 探 索 即 时 编译 舌 的 运作 过 程 。 


由 于 Java 虚 拟 机 规范 没有 具体 的 约束 规则 去 限制 即时 编译 器 应 该 
如 何 实现 ， 所 以 这 部 分 功能 完全 是 与 虚拟 机 具体 实现 (Implementation 
Specific) 相关 的 内 容 ， 如 无 特殊 说 明 ， 本 章 提 及 的 编译 器 、 即 时 编译 
虱 都 是 指 HotSpot 虚 拟 机 内 的 即时 编译 侣 ， 虚 拟 机 也 是 特 指 HotSpot 虚 
拟 机 。 不 过 ， 本 章 的 大 部 分 内 容 是 描述 即时 编译 嘎 的 行为 ， 涉 及 编译 
妖 实 现 层面 的 内 容 较 少 ， 而 主流 虚拟 机 中 即时 编译 器 的 行为 义 有 很 多 
相似 和 相通 之 处 ， 因 此 ， 对 其 他 虚拟 机 来 说 也 具有 较 高 的 参考 意义 。 


11.2 ” HotSpot 虚拟 机 内 的 即时 编译 絮 


在 本 节 中 ， 我 们 将 要 了 解 HotSpot 虚 拟 机 内 的 即时 编译 器 的 运作 过 
程 ， 同 时 ， 还 要 解决 以 下 几 个 问题 : 


为 何 HotSpot 虚 拟 机 要 使 用 解释 紫 与 编译 占 并 存 的 染 构 ? 


为 何 HotSpot 虚 拟 机 要 实现 两 个 不 同 的 即时 编译 各? 
程序 何 时 使 用 解释 器 执行 ? 何 时 使 用 编译 器 执行 ? 


哪些 程序 代码 会 被 编译 为 本 地 代码 ? 如 何 编 译 为 本 地 代码 ? 


如 何 从 外 部 观察 即时 编译 需 的 编译 过 程 和 编译 结 采 ? 


11.2.1 解释 需 与 编译 需 


尽管 并 不 古 所 有 的 Java 虚 拟 机 都 采用 解释 器 与 编译 局 并 存 的 架构 ， 
但 许多 主流 的 商用 虚拟 机 ， 如 HotSpot、J9 等 ， 都 同时 包含 解释 器 与 编 
译 器 1 。 解 释 器 与 编译 器 两 者 各 有 优势 ， 当 程序 需要 迅速 局 动 和 执行 的 
时 候 ， 解 释 器 可 以 首先 发 挥 作用 ， 省 去 编译 的 时 间 ， 立 即 执行 。 在 程 
序 运 行 后 ， 随 着 时 间 的 推移 ， 编 译 器 逐渐 发 挥 作用 ， 把 越 来 越 多 的 代 
码 编译 成 本 地 代码 之 后 ， 可 以 获取 更 高 的 执行 效率 。 当 程序 运行 环境 


中 内 存 资源 限制 较 大 〈 如 部 分 嵌入 式 系统 中 ) ， 可 以 使 用 解释 执行 市 
约 内 存 ， 反 之 可 以 使 用 编译 执行 来 提升 效率 。 同 时 ， 人 解释 右 还 可 以 作 
为 编译 器 激进 优化 时 的 一 个 “逃生 门 ?， 让 编译 器 根据 概率 选择 一 些 大 
多 数 时 候 都 能 提升 运行 速度 的 优化 手段 ， 当 激进 优化 的 假设 不 成 立 ， 

如 加 载 了 新 类 后 类 型 继承 结构 出 现 变 化 、 出 现 “ 罕 见 陷阱 ” (Uncommon 
Trap) 时 可 以 通过 逆 优 化 〈Deoptimization) 退回 到 解释 状态 继续 执行 
(部 分 没有 解释 器 的 虚拟 机 中 也 会 采用 不 进行 激进 优化 的 C1 编译 器 中 
担任 “逃生 门 ?的 角色 ) ， 因 此 ， 在 整个 虚拟 机 执行 架构 中 ， 解 释 器 与 
编译 亏 经 音 配 合 工作 ， 如 图 11-1 所 示 。 


即时 编译 
解释 器 编译 需 
SRE a BB 
i 1 | | 
| | | Client Compiler | 
1 | | 1 
| | | | 
| : | Server Compiler | 
| | 
二 J » 
逆 优 化 


图 11-1 解释 右 与 编译 絮 的 交互 


HotSpot 虚 拟 机 中 内 置 了 两 个 即时 编译 器 ， 分 别称 为 Client Compiler 
和 Server Compiler， 或 者 简称 为 C1 编译 器 和 C2 编译 器 〈 也 叫 Opto 编 译 
句 ) 。 目 前 主流 的 HotSpot 虚 拟 机 (Sun 系列 JDK 1.7 及 之 前 版 本 的 虚拟 


机 ) 中 ， 默 认 采 用 解释 器 与 其 中 一 个 编译 器 直接 配合 的 方式 工作 ， 程 
序 使 用 哪个 编译 器 ， 取 决 于 虚拟 机 运行 的 模式 ，HotSpot 虚 拟 机 会 根据 
目 身 版 本 与 宿主 机 器 的 硬件 性 能 目 动 选 择 运行 模式 ， 用 户 也 可 以 使 用 "- 
client" 或 "-server" 参 数 去 强制 指定 虚拟 机 运行 在 Client 模 式 或 Server 模 

式 o 


无 论 采用 的 编译 器 是 Client Compiler 还 是 Server Compiler， 解 释 器 
与 编译 侣 搭配 使 用 的 方式 在 虚拟 机 中 称 为 “混合 模式 ” (Mixed 
Mode) ， 用 户 可 以 使 用 参数 "-Xint" 强 制 虚拟 机 运行 于 “解释 模 
式 ”(Interpreted Mode) ， 这 时 编译 妖 完 全 不 介入 工作 ， 全 部 代码 都 使 
用 解释 方式 执行 。 男 外 ， 也 可 以 使 用 参数 "-Xcomp" 强 制 虚 拟 机 运行 
于 “编译 模式 ”(Compiled Mode) 四， 这 时 将 优先 采用 编译 方式 执行 程 
序 ， 但 是 解释 器 仍然 要 在 编译 无 法 进行 的 情况 下 介入 执行 过 程 ， 可 以 
通过 虚拟 机 的 "-version" 命 令 的 输出 结果 显示 出 这 3 种 模式 ， 如 代码 清单 


11-1 所 示 ， 请 注意 黑体 字 部 分 。 


代码 清单 11-1 虚拟 机 执行 模式 


C:\>java-version 

java version"1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server VM (build 0.2-b02-internal, 
19.0-b04-internal,mixed mode) 

C:\>java-Xint-version 

java version"1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server VM (build 0.2-b02-internal, 
19.0-b04-internal, interpreted mode) 

C:\>java-Xcomp-version 


java version"1.6.0 22" 

Java (TM) SE Runtime Environment (build 1.6.0 22-b04) 

Dynamic Code Evolution 64-Bit Server VM (build 0.2-b02-internal, 
19.0-b04-internal,compiled mode) 


由 于 即时 编译 句 编 译本 地 代码 需要 占用 程序 运行 时 间 ， 要 编译 出 
优化 程度 更 高 的 代码 ， 所 花费 的 时 间 可 能 更 长 ， 而 且 想 要 编译 出 优化 
程度 更 高 的 代码 ， 解 释 器 可 能 还 要 替 编 译 需 收集 性 能 监控 信息 ， 这 对 
解释 执行 的 速度 也 有 影响 。 为 了 在 程序 启动 响应 速度 与 运行 效率 之 间 
达到 最 佳 平衡 ，HotSpot 虚 拟 机 还 会 逐渐 启用 分 层 编 译 (Tiered 
Compilation) 包 的 策略 ， 分 层 编译 的 概念 在 JDK 1.6 时 期 出 现 ， 后 来 一 
直 处 于 改进 阶段 ， 最 终 在 JDK 1.7 的 Server 模 式 虚 拟 机 中 作为 默认 编译 
策略 被 开启 。 分 层 编 译 根 据 编译 器 编译 、 优 化 的 规模 与 耗 时 ， 划 分 出 
不 同 的 编译 层次 ， 其 中 包括 : 


第 0 层 ， 程 序 解释 执行 ， 解 释 器 不 开启 性 能 监控 功能 
(Profiling) ， 可 触发 第 1 层 编译 。 


第 1 层 ， 也 称 为 C1 编 译 ， 将 字 世 码 编译 为 本 地 代码 ， 进 行 简单 、 可 
靠 的 优化 ， 如 有 必要 将 加 入 性 能 监控 的 逻辑 。 


第 2 层 (或 2 层 以 上 ) ， 也 称 为 C2 编 译 ， 也 是 将 字 节 码 编译 为 本 地 
代码 ， 但 是 会 后 用 一 些 编译 耗 时 较 长 的 优化 ， 甚 至 会 根据 性 能 监控 信 
轧 进 行 一 些 不 可 车 的 激进 优化 。 


实施 分 层 编译 后 ，Client Compiler 和 Server Compiler 将 会 同时 工 
作 ， 许 多 代码 都 可 能 会 被 多 次 编译 ， 用 Client Compiler 获 取 更 高 的 编译 
速度 ， 用 Server Compiler 来 获取 更 好 的 编译 质量 ， 在 解释 执行 的 时 候 也 
无 须 再 承担 收集 性 能 监控 信息 的 任务 。 


[1] 作 为 三 大 商用 虚拟 机 之 一 的 JRockit 是 个 例外 ， 它 内 部 没有 解释 器 ， 
因此 会 存在 本 书 中 所 说 的 “启动 啊 应 时 间 长 ”之 类 的 缺点 ， 但 它 主要 是 
面向 服务 端的 应 用 ， 这 类 应 用 一 般 不 会 重点 关注 局 动 时 间 。 

[2] 在 虚拟 机 中 习惯 将 Client Compiler 称 为 C1， 将 Server Compiler 称 为 
C2。 

[3] 在 最 新 的 Sun HotSpot 中 ， 已 经 去 掉 了 -Xcomp 参 数 。 

[4]Tiered Compilation 的 概念 在 JDK 1.6 时 期 出 现 ， 但 JDK 1.7 之 前 需要 使 
用 -XX:+TieredCompilation 参 数 来 手动 开局 ， 如 采 不 开局 分 层 编译 策 
上 略 ， 而 虚拟 机 又 运行 在 Server 模 式 ，Server Compiler 需 要 性 能 监控 信息 
提供 编译 依据 ， 则 可 以 由 解释 如 收集 性 能 监控 信息 供 Server Compiler 使 
用 。 分 层 编译 的 相关 资料 可 参见 


http://weblogs.java.net/blog/forax/archive/2010/09/04/tiered-compilation ° 


11.2.2 ”编译 对 象 与 触发 条 件 


上 文中 提 到 过 ， 在 运行 过 程 中 会 被 即时 编译 硕 编 译 的 “热点 代 
码 ” 有 两 类 ， 即 : 


被 多 次 调用 的 方法 。 

被 多 次 执行 的 循环 体 。 

前 者 很 好 理解 ， 一 个 方法 被 调用 得 多 了 ， 方 法 体内 代码 执行 的 次 
数 自 然 就 多 ， 它 成 为 “热点 代码 ”是 理所当然 的 。 而 后 者 则 是 为 了 解决 
一 个 方法 只 人 被 调用 过 一 次 或 少量 的 几 次 ,但 是 方法 体内 部 存在 循环 次 
数 较 多 的 循环 体 的 问题 ， 这 样 循 环 体 的 代码 也 被 重复 执行 多 次 ， 因 此 
这 些 代码 也 应 该 认为 是 “热点 代码 ”。 


对 于 第 一 种 情况 ， 由 于 是 由 方法 调用 触发 的 编译 ， 因 此 编译 器 理 
所 当然 地 会 以 整个 方法 作为 编译 对 象 ， 这 种 编译 也 是 虚拟 机 中 标准 的 
JIT 编 译 方式 。 而 对 于 后 一 种 情况 ， 尽 管 编译 动作 是 由 循环 体 所 触发 
的 ， 但 编译 器 依然 会 以 整个 方法 (而 不 是 单独 的 循环 体 ) 作为 编译 对 
象 。 这 种 编译 方式 因为 编译 发 生 在 方法 执行 过 程 之 中 ， 因 此 形象 地 称 
之 为 栈 上 替换 (On Stack Replacement， 简 称 为 OSR 编 译 ， 即 方法 栈 帧 
还 在 栈 上 ， 方 法 就 被 替换 了 ) 。 


者 可 能 还 会 有 疑问 ， 在 上 面 的 文字 摘 述 中 ， 无 论 是 “多 次 执行 的 
方法 ”， 还 是 “多 次 执行 的 代码 块 >， 所 谓 " 多 次 ?部 不 是 一 个 具体 、 产 韶 
的 用 语 ， 那 到 奈 多 少 次 才 算 “多 次 ” 呢 ? 还 有 一 个 问题 ， 束 是 虚拟 机 如 
何 统计 一 个 方法 或 一 段 代 码 被 执行 过 多 少 次 呢 ? 解决 了 这 两 个 问题 ， 

也 就 回答 了 即时 编译 被 触发 的 条 件 。 


泪 


判断 一 段 代码 是 不 是 热点 代码 ， 征 不 是 需要 触发 即时 编译 ， 这 样 
的 行为 称 为 热点 探测 (Hot Spot Detection) ， 其 实 进行 热点 探测 并 不 一 
定 要 知道 方法 具体 被 调用 了 多 少 次 ， 目 前 主要 的 热点 探测 判定 方式 有 
两 种 站， 分 别 如 下 。 


基于 采样 的 热点 探测 (Sample Based Hot Spot Detection) : 采用 这 
种 方法 的 虚拟 机 会 周期 性 地 检查 各 个 线程 的 栈 顶 ， 如 果 发 现 某 个 (或 
某 些 ) 方法 经 常 出 现在 栈 顶 ， 那 这 个 方法 就 是 “热点 方法 ”。 基 于 采样 
的 热点 探测 的 好 处 是 实现 简单 、 高 效 ， 还 可 以 很 容易 地 获取 方法 调用 
关系 (将 调用 堆栈 展开 即 可 ) ,缺点 是 很 难 精 确 地 确认 一 个 方法 的 热 
度 ， 容 易 因 为 受到 线程 阻塞 或 别 的 外 界 因素 的 影响 而 扰乱 热点 探测 。 


~ 


基于 计数 器 的 热点 探测 (Counter Based Hot Spot Detection) : 采 
用 这 种 方法 的 虚拟 机 会 为 每 个 方法 〈 甚 至 是 代码 块 ) 建立 计数 器 ， 统 
计 方 法 的 执行 次 数 ， 如 果 执 行 次 数 超过 一 定 的 立 值 就 认为 它 是 “热点 方 
法 ”。 这 种 统计 方法 实现 起 来 麻烦 一 些 ， 需 要 为 每 个 方法 建立 并 维护 计 


数 邵 ， 而 且 不 能 和 直接 获取 到 方法 的 调用 关系 ， 但 是 它 的 统计 结果 相对 
来 说 更 加 精确 和 严 讶 。 
在 HotSpot 虚 拟 机 中 使 用 的 是 第 二 种 一 -基于 计数 圳 的 热点 探测 方 
法 ， 因 此 它 为 每 个 方法 准备 了 两 类 计数 器 : 方法 调用 计数 希 
(Invocation Counter) 和 回 边 计数 器 (Back Edge Counter) 。 
在 确定 虚拟 机 运行 参数 的 前 提 下 ， 这 两 个 计数 姻 都 有 一 个 确定 的 
出 值 ， 当 计数 絮 超 过 病 值 洲 出 了 ， 就 会 触发 JIT 编 译 。 


我 们 首先 来 看 看 方法 调用 计数 器 。 顾 名 思 义 ， 这 个 计数 句 就 用 于 
统计 方法 被 调用 的 次 数 ， 它 的 默认 病 值 在 Client 模 式 下 是 1500 次 ， 在 
Server 模 式 下 是 10 000 次 ， 这 个 国 值 可 以 通过 虚拟 机 参数 - 
XX:CompileThreshold 来 人 为 设 定 。 当 一 个 方法 被 调用 时 ， 会 移 检 查 该 
方法 是 否 存 在 被 IT 编 译 过 的 版 本 ， 如 果 存 在 ， 则 优先 使 用 编译 后 的 本 
地 代码 来 执行 。 如 果 不 存在 已 被 编译 过 的 版 本 ， 则 将 此 方法 的 调用 计 
数 器 值 加 1， 然 后 判断 方法 调用 计数 器 与 回 边 计数 器 值 之 和 是 否 超 过 方 
法 调用 计数 右 的 病 值 。 如 果 已 超过 阔 值 ， 那 么 将 会 向 即时 编译 器 提交 
一 个 该 方法 的 代码 编译 请 求 。 


如 采 不 做 任何 设置 ， 执 行 引 擎 并 不 会 同步 等 竺 编译 请 求 完 成 ， 而 
征 继 续 进 入 解释 器 按照 解释 方式 执行 字 节 码 ， 直 到 提交 的 请 求 被 编译 
右 编 译 完 成 。 当 编译 工作 完成 之 后 ， 这 个 方法 的 调用 入 口 地 址 束 会 被 


系统 自动 改写 成 新 的 ， 下 一 次 调用 该 方法 时 就 会 使 用 已 编译 的 版 本 。 
整个 JIT 编 译 的 交互 过 程 如 图 11-2 所 示 。 


Java 方 法 入 口 


是 否 存在 已 编译 版 本 
方法 调用 计数 需 值 加 1 


执行 编译 后 的 本 地 代码 版 本 


两 计数 融 值 之 和 
是 否 超过 闭 值 


向 编译 融 提 交 编 译 请 求 
以 解释 方式 执行 方法 


Java 方 法 返回 


图 11-2 方法 调用 计数 器 触发 即时 编译 


如 果 不 做 任何 设置 ， 方 法 调用 计数 器 统计 的 并 不 是 方法 被 调用 的 
绝对 次 数 ， 而 是 一 个 相对 的 执行 频率 ， 即 一 段 时 间 之 内 方法 被 调用 的 
次 数 。 当 超过 一 定 的 时 间 限 度 ， 如 果 方 法 的 调用 次 数 仍然 不 足以 让 它 
提交 给 即时 编译 器 编译 ， 那 这 个 方法 的 调用 计数 器 就 会 被 减少 一 半 ， 
这 个 过 程 称 为 方法 调用 计数 器 热度 的 衰减 (Counter Decay) ， 而 这 段 
时 间 就 称 为 此 方法 统计 的 半 衰 周期 (Counter Half Life Time) 。 进 行 执 
度 衰 减 的 动作 是 在 虚拟 机 进行 垃圾 收集 时 顺便 进行 的 ， 可 以 使 用 虚拟 
机 参数 -XX:-UseCounterDecay 来 关闭 热度 衰减 ， 计 方法 计数 器 统计 方法 
调用 的 绝对 次 数 ， 这 样 ， 只 要 系统 运行 时 间 足 够 长 ， 绝 大 部 分 方法 都 
会 被 编译 成 本 地 代码 。 男 外 ， 可 以 使 用 -XX:CounterHalfLifeTime 参 数 设 
置 半 衰 周 期 的 时 间 ， 单 位 是 秒 。 


现在 我 们 再 来 看 看 另外 一 个 计数 器 一 一 回 边 计 数 右 ， 它 的 作用 是 
统计 一 个 方法 中 循环 体 代 码 执行 的 次 数 阁 ， 在 字 节 码 中 遇 到 控制 流向 后 
跳 转 的 指令 称 为 “ 回 边 ”\Back Edge) 。 显然， 建立 回 边 计 数 器 统计 的 
目的 就 是 为 了 触发 OSR 编 译 。 


关于 回 边 计数 器 的 闵 值 ， 虽 然 HotSpot 虚 拟 机 也 提供 了 一 个 类 似 于 
方法 调用 计数 器 阔 值 -XX:CompileThreshold 的 参数 - 
XX:BackEdgeThreshold 供 用 户 设置 ， 但 是 当前 的 虚拟 机 实际 上 并 未 使 
用 此 参数 ， 因 此 我 们 需要 设置 另外 一 个 参数 - 


XX:OnStackReplacePercentage 来 间接 调整 回 边 计数 如 的 国 值 ， 其 计算 公 
EA bs 


虚拟 机 运行 在 Client 模 式 下 ， 回 边 计 数 右 病 值 计算 公式 为 : 


方法 调用 计数 器 阔 值 (CompileThreshold) xOSR 比 率 


(OnStackReplacePercentage) /100 


其 中 OnStackReplacePercentage 默 认 值 为 933， 如 果 都 取 默 认 值 ， 那 
Client 模 式 虚 拟 机 的 回 边 计数 器 的 阀 值 为 13995 。 


虚拟 机 运行 在 Server 模 式 下 ， 回 边 计数 融 国 值 的 计算 公式 为 : 


方法 调用 计数 器 阔 值 (CompileThreshold) x (OSR 比 率 
(OnStackReplacePercentage) -解释 器 监控 比率 


(InterpreterProfilePercentage) /100 


其 中 OnStackReplacePercentage 默 认 值 为 140， 
InterpreterProfilePercentage 默 认 值 为 33， 如 有 果 都 取 默 认 什 ， 那 Server 模 
式 虚 拟 机 回 边 计数 需 的 靖 值 为 10700 。 


当 解 释 器 过 到 一 条 回 边 指令 时 ， 会 先 查 找 将 要 执行 的 代码 片段 是 
否 有 已 经 编译 好 的 版 本 ， 如 果 有 ， 它 将 会 优先 执行 已 编译 的 代码 ， 否 
则 束 把 回 边 计 数 右 的 值 加 1， 然 后 判断 方法 调用 计数 紫 与 回 边 计数 如 值 
之 和 是 否 超 过 回 边 计数 器 的 国 值 。 当 超过 立 值 的 时 候 ， 将 会 提交 一 个 


OSR 编 译 请 求 ， 并 且 把 回 边 计数 硕 的 值 降低 一 些 ， 以 便 继 续 在 解释 大 
中 执行 循环 ， 等 待 编译 器 输出 编译 结果 ， 整 个 执行 过 程 如 图 11-3 所 示 。 


遇 到 回 边 指令 


是 否 存在 已 编译 版 本 


芯 


回 边 计 数 需 值 加 1 执行 编译 后 的 本 地 代码 版 本 


两 计数 带 值 之 和 
是 否 超 过 国 值 


是 
向 编译 器 提交 OSR 编 译 请 求 
否 
释 方 式 继续 执行 


调整 回 边 计数 器 值 


以 解释 方式 继续 执行 


图 11-3 回 边 计数 右 触 发 即时 编译 


与 方法 计数 器 不 同 ， 回 边 计数 器 没有 计数 热度 衰减 的 过 程 ， 因 此 
这 个 计数 器 统计 的 就是 该 方法 循环 执行 的 绝对 次 数 。 当 计数 器 次 出 的 
时 候 ， 它 还 会 把 方法 计数 大 的 值 也 调整 到 溢出 状态 ， 这 样 下 次 再 进入 
该 方法 的 时 候 束 会 执行 标准 编译 过 程 。 


最 后 需要 提醒 一 点 ， 图 11-2 和 图 11-3 都 仅仅 描述 了 Client VM 的 即 
时 编译 方式 ， 对 于 Server VM 来 说 ， 执 行情 况 会 比 上 面 的 描述 更 复杂 一 
些 。 从 理论 上 了 解 过 编译 对 象 和 编译 触发 条 件 后 ， 我 们 再 从 HotSpot 虚 
拟 机 的 源码 中 观察 一 下 ， 在 MethodOop.hpp (一 个 methodOop 对 象 代表 
了 一 个 Java 方 法 ) 中 ， 定 义 了 Java 方 法 在 虚拟 机 中 的 内 存 布局 ， 如 下 所 


不 : 


header 
klass 
constMethodOop (oop) 
constants (oop) 
methodData (oop) 


interp invocation count 
access flags | 
vtable index 


result: index (C++ interpreter only) 


method_ size | max_stack 

max_locals | size of parameters 
intrinsice idl flags | throwout count | 
num breakpoints | (unused) 


invocation counter 


backedge counter 


prev time {tiered only: 64 bit wide) 


rate (tiered) 


code (pointer) 
主 这 证 (pointer) 
adapter (pointer) 
from compiled entry (Pointer) 
from interpreted entry (pointer) 
native. function (present only if native) 
signature handler (present only if native) 


在 这 个 内 存 布局 中 ， 一 行 长 度 为 32 bit， 从 中 可 以 清楚 地 看 到 方法 
调用 计数 器 和 回 边 计数 器 所 在 的 位 置 和 长 度 。 还 有 from_compiled_entry 
和 from_interpreted_entry 这 两 个 方法 的 入 口 。 


[] 除 这 两 种 方式 外 ， 还 有 其 他 热点 代码 的 探测 方式 ， 如 基于 * 踩 
迹 ”(Trace) 的 热点 探测 在 最 近 相 当 流 行 ， 像 FireFox 中 的 TraceMonkey 
和 Dalvik 中 新 的 IT 编 译 器 都 用 了 这 种 热点 探测 方式 。 

[2] 准 确 地 说 ， 应 当 是 回 边 的 次 数 而 不 是 循环 次 数 ， 因 为 并 非 所 有 的 循 
环 部 是 回 边 ， 如 空 循环 实际 上 束 可 以 视 为 目 己 跳 转 到 目 己 的 过 程 ， 
此 并 不 算 作 控制 流 同 后 跳 转 ， 也 不 会 被 回 边 计 数 右 统计 。 


11.2.3 ”编译 过 程 


在 默认 设置 下， 无论 是 方法 调用 产生 的 即时 编译 请 求 ， 还 是 OSR 
编译 请 求 ， 虚 拟 机 在 代码 编译 器 还 未 完成 之 前 ， 都 仍然 将 按照 解释 方 
式 继续 执行 ， 而 编译 动作 则 在 后 台 的 编译 线程 中 进行 。 用 户 可 以 通过 
参数 -XX:-BackgroundCompilation 来 禁止 后 台 编 译 ， 在 禁止 后 台 编 译 
后 ， 一 旦 达到 JIT 的 编译 条 件 ， 执 行 线程 向 虚拟 机 提交 编译 请 求 后 将 会 
一 直 等 待 ， 直 到 编译 过 程 完 成 后 再 开始 执行 编译 名 输出 的 本 地 代码 。 


那么 在 后 台 执 行 编译 的 过 程 中 ， 编 译 右 做 了 什么 事情 呢 ? Server 
Compiler 和 Client Compiler 两 个 编译 器 的 编译 过 程 是 不 一 样 的 。 对 于 
Client Compiler 来 说 ， 它 是 一 个 简单 快速 的 三 段 式 编译 做 ， 主 要 的 天 广 
点 在 于 局 部 性 的 优化 ， 而 放弃 了 许多 耗 时 较 长 的 全 局 优化 手段 。 


在 第 一 个 阶段 ， 一 个 平台 独立 的 前 端 将 字 节 码 构造 成 一 种 高 级 中 
间 代 码 表示 (High-Level Intermediate Representaion,HIR) 。HIR 使 用 静 
态 单 分 配 (Static Single Assignment,SSA) 的 形式 来 代表 代码 值 ， 这 可 
以 使 得 一 些 在 HIR 的 构造 过 程 之 中 和 之 后 进行 的 优化 动作 更 容易 实现 。 
在 此 之 前 编译 器 会 在 字 节 码 上 完成 一 部 分 基础 优化 ， 如 方法 内 联 、 常 
量 传播 等 优化 将 会 在 字 节 码 被 构造 成 HIR 之 前 完成 。 


在 第 二 个 阶段 ， 一 个 平台 相关 的 后 端 从 HIR 中 产生 低级 中 间 代 码 表 
示 (Low-Level Intermediate Representation,LIR) ， 而 在 此 之 前 会 在 HIR 
上 完成 男 外 一 些 优化 ， 如 空 值 检 查 消除 、 范 围 检 查 消除 等 ， 以 便 让 HIR 
达到 更 高 效 的 代码 表示 形式 。 


最 后 阶段 是 在 平台 相关 的 后 端 使 用 线性 扫描 算法 (Linear Scan 
Register Allocation) 在 LIR 上 分 配 寄存 器 ， 并 在 LIR 上 做 宁 孔 
(Peephole) 优化 ， 然 后 产生 机 器 代码 。Client Compiler 的 大 致 执行 过 
程 如 图 11-4 所 示 。 


人 化 的 下 


常量 传播 宕 孔 优 化 
其 他 优化 空 值 检查 消除 机 咒 码 生成 


范围 检查 消除 


HIR (SSA 形 式 ) 本 地 代码 


其 他 优化 


前 端 后 端 
图 11-4 ”Client Compiler 架 构 


而 Server Compiler 则 是 专门 面 辣 服务 端的 典型 应 用 并 为 服务 端的 性 
能 配置 特别 调整 过 的 编译 器， 也 是 一 个 充分 优化 过 的 高 级 编译 器 ， 几 


乎 能 达到 GNU C++ 编译 器 使 用 -02 参 数 时 的 优化 强度 ， 它 会 执行 所 有 经 

典 的 优化 动作 ， 如 无 用 代码 消除 (Dead Code Elimination) 、 循 环 展开 
(Loop Unrolling) 、 循 环 表达 式 外 提 (Loop Expression Hoisting) 、 消 

除 公 共 子 表达 式 (Common Subexpression Elimination) 、 常 量 传播 


(Constant Propagation) 、 基 本 块 重 排序 (Basic Block Reordering ) 

等 ， 还 会 实施 一 些 与 Java 语 言 特 性 密切 相关 的 优化 技术 ， 如 范围 检查 消 
除 ee Check Elimination) 、 空 值 检查 消除 (Null Check 
Elimination， 不 过 并 非 所 有 的 空 值 检查 消除 都 是 依赖 编译 器 优化 的 ， 有 
一 些 是 在 代码 运行 过 程 中 自动 优化 了 ) 等 。 男 外 ， 还 可 能 根据 解释 器 
或 Client Compiler 提 供 的 性 能 监控 信息 ， 进 行 一 些 不 稳定 的 激进 优化 ， 
如 守护 内 联 (Guarded Inlining) 、 分 支 频 率 预 测 (Branch Frequency 
Prediction) 等 。 本 章 的 下 半 部 分 将 会 挑选 上 述 的 一 部 分 优化 手段 进行 
分 析 和 讲解 。 


Server Compiler 的 寄存 右 分 配 融 是 一 个 全 局 图 看 色 分 配 融 ， 它 可 以 
充分 利用 某 些 处 理 器 架构 (如 RISC) 上 的 大 寄存 器 集合 。 以 即时 编译 
的 标准 来 看 ，Server Compiler 无 疑 是 比较 缓慢 的 ， 但 它 的 编译 速度 依然 
远 远 超 过 传统 的 静态 优化 编译 做， 而 且 它 相 对 于 Client Compiler 编 详 输 
出 的 代码 质量 有 所 提高 ， 可 以 减少 本 地 代码 的 执行 时 间 ， 从 而 抵消 了 
额外 的 编译 时 间 开 销 ， 所 以 也 有 很 多 非 服务 端的 应 用 选择 使 用 Server 梗 
式 的 虚拟 机 运行 。 


在 本 节 中 ， 涉 及 了 许多 编译 原理 和 代码 优化 中 的 概念 名 词 ， 没 有 
这 方面 基础 的 读者 ， 阅 读 起 来 会 感觉 到 抽象 和 理论 化 。 有 这 种 感觉 并 
不 琳 怪 ，JIT 编 详 过 程 本 来 整 古 一 个 虚拟 机 中 最 体现 技术 水 平 也 是 最 复 
杂 的 部 分 ， 不 可 能 以 较 短 的 篇 幅 避 ® 介 绍 得 很 详细 ， 男 外 ， 这 个 过 程 对 
Java 开 发 来 说 是 透明 的 ， 程 序 员 平 时 无 法 感知 它 的 存在 ， 还 好 HotSpot 
虚拟 机 提供 了 两 个 可 视 化 的 工具 ， 让 我 们 可 以 “看 见 *JIT 编 译 器 的 优化 
过 程 ， 在 稍 后 笔 着 将 演示 这 个 过 程 。 


11.2.4 查看 及 分 析 即 时 编译 结果 


一 般 来 说 ， 虚 拟 机 的 即时 编译 过 程 对 用 户 程序 是 完全 透明 的 ， 虚 
拟 机 通过 解释 执行 代码 还 是 编译 执行 代码 ， 对 于 用 户 来 说 并 没有 什么 
影响 〈 执 行 结果 没有 影响 ， 速 度 上 会 有 很 大 差别 ) ， 在 大 多 数 情 况 下 
用 户 也 没有 必要 知道 。 但 是 虚拟 机 也 提供 了 一 些 参数 用 来 输出 即时 编 
译 和 某 些 优化 手段 (如 方法 内 联 ) 的 执行 状况 ， 本 节 将 介绍 如 何 从 外 
部 观察 虚拟 机 的 即时 编译 行为 。 


本 世 中 提 到 的 运行 参数 有 一 部 分 需要 Debug 或 FastDebug 版 虚拟 机 
的 支持 ，Product 版 的 虚拟 机 无 法 使 用 这 部 分 参数 。 如 果 读 者 使 用 的 是 
根据 本 书 第 1 章 的 内 容 自己 编译 的 JDK， 注 意 将 SKIP DEBUG_BUILD 
或 SKIP FASTDEBUG_BUILD 参 数 设置 为 false， 也 可 以 在 OpenJDK 网 
站 上 直接 下 载 FastDebug 版 的 JDK (从 JDK 6u25 之 后 Oracle 官 网 就 不 再 
提供 FastDebug 的 JDK 下 载 了 ) 。 注 意 ， 本 市 中 所 有 的 测试 都 基于 代码 
清单 11-2 所 示 的 Java 代 码 。 


代码 清单 11-2 ”测试 代码 


public static final int NUM=15000; 
public static int doublevalue (int i) { 
// 这 个 空 循环 用 于 后 面 演示 JIT 代 码 优 化 过 程 
for (int j=0; j<100000; j++) ; 
return i*2; 


} 
public static long calcSum( ){ 


long sum=0; 

for (int i=1; i<=100; i++) { 
sum+=doubleVvalue (i); 

} 

return sunm; 

public static void main (String[]args) { 
for (int i=0; i<NUM; I++) { 

calcSunm( ); 


} 


自 完 运行 这 段 代码 ， 并 且 确 认 这 上 段 代 码 是 否 触 发 了 即时 编译 ， 要 
知道 某 个 方法 是 否 补 编译 过 ， 可 以 使 用 参数 -XX:+PrintCompilation 要 求 
虚拟 机 在 即时 编译 时 将 被 编译 成 本 地 代码 的 方法 名 称 打印 出 来 ， 如 代 
码 清 单 11-3 所 示 (其 中 带 有 “%” 的 输出 说 明 是 由 回 边 计数 右 触 发 的 OSR 
绩 译 ) 。 


代码 清单 11-3 ”被 即时 编译 的 代码 


VM option'+PrintCompilation' 

310 1 java.lang.String:charAt (33 bytes) 

329 2 org.fenixsoft.jit.Test:calcSum (26 bytes) 
329 3 org.fenixsoft.jit.Test:doublevalue (4 bytes) 
332 1%org.fenixsoft.jit.Test:main@5 (20 bytes) 


从 代码 清单 11-3 输 出 的 确认 信息 中 可 以 确认 main()、calcSsumO 和 
doubleValue() 方 法 已 经 被 编译 ， 我 们 还 可 以 加 上 参数 -XX:+PrintInlining 
要 求 虚 拟 机 输出 方法 内 联 信息 ， 如 代码 清单 11-4 所 示 。 


代码 清单 11-4 内 联 信息 


VM option'+PrintCompilation' 

VM option'+PrintInlining' 

273 1 java.lang.Sstring:charAt (33 bytes) 

291 2 org.fenixsoft.jit.Test:calcSum (26 bytes) 

@9 org.fenixsoft.jit.Test:doublevalue inline (hot) 
294 3 org.fenixsoft.jit.Test:doubleVvalue (4 bytes) 
295 1%org.fenixsoft.jit.Test:main@5 (20 bytes) 


@5 org.fenixsoft.jit.Test:calcSum inline (hot) 


@9 org.fenixsoft.jit.Test:doublevalue inline (hot) 


从 代码 清单 11-4 的 输出 中 可 以 看 到 方法 doublevalue0 被 内 联 编译 到 
calcSum(0 中 ， 而 calcSum0 又 被 内 联 编译 到 方法 main0) 中 ， 所 以 虚拟 机 再 
次 执行 main() 方 法 的 时 候 〈 举 例 而 已 ，main( 方 法 并 不 会 运行 两 次 ) ， 
calcSum(0 和 doublevValue0 方 法 都 不 会 再 和 被 调用 ， 它 们 的 代码 逻辑 都 被 直 
接 内 联 到 main() 方 法 中 了 。 


除了 查看 哪些 方法 被 编译 之 外 ， 还 可 以 进一步 查看 即时 编译 器 生 
成 的 机 器 码 内 容 ， 不 过 如 果 虚 拟 机 输出 一 串 0 和 1， 对 于 我 们 的 阅读 来 
说 是 没有 意义 的 ， 机 器 码 必须 反 汇 编 成 基本 的 汇编 语言 才 可 能 被 阅 
读 。 虚 拟 机 提供 了 一 组 通用 的 反 汇 编 接口 帆 ， 可 以 接 入 各 种 平台 下 的 反 
汇编 适配器 来 使 用 ， 如 使 用 32 位 80x86 平 台 则 选用 hsdis-i386 适 配器 ， 其 
余 平台 的 适配器 还 有 hsdis-amd64、hsdis-sparc 和 hsdis-sparcv9 等 ， 可 以 
下 载 或 自己 编译 出 反 汇 编 适 配器 2 ， 然 后 将 其 放置 在 JRE/bin/client 
或 /server 目 录 下 ， 只 要 与 jvm.dll 的 路 径 相 同 即 可 被 虚拟 机 调用 。 在 为 虚 
拟 机 安装 了 反 汇 编 适配器 之 后 ， 就 可 以 使 用 -XX:+PrintAssembly 参 数 要 
求 虚 拟 机 打印 编译 方法 的 汇编 代码 了 ， 具 体 的 操作 可 以 参考 本 书 4.2.7 


+4 


人 了] O 


如 采 没 有 HSDIS 皇 件 文 择 ， 也 可 以 使 用 -XXX:+PrintOptoAssembly 
(用 于 Server VM) 或 -XX:+PrintLIR (用 于 Client VM) 来 输出 比较 接 
最 终结 果 的 中 间 代 码 表示 ， 代 码 清 单 11-2 被 编译 后 部 分 反 汇 编 (使 
用 ee 的 输出 结果 如 代码 请 单 11-5 所 示 。 从 阅读 
角度 来 说 ， 使 用 -XX:+PrintOptoAssembly 参 数 输 出 的 伪 汇 编 结果 包含 了 
更 多 的 信息 (主要 是 注释 ) ， 利 于 阅读 并 理解 虚拟 机 JIT 编 译 器 的 优化 
结果 。 


代码 清单 11-5 ”本 地 机 器 码 反 汇编 信息 (部 分 ) 


000 B1:#N1< -BLOCK HEAD IS JUNK Freq:1 

000 pushq rbp 

subq rsp, #16#Create frame 

nop#nop for patch_verified_entry 

006 movl1l RAX,RDX#spill 

008 sall RAX, #1 

00a addq rsp, 16#Destroy frame 

popq rbp 

testl rax, [rip+#offset_to_ poll pagel#Safepoint:poll for GC 


前 面 提 到 的 使 用 -XX:+PrintAssembly 参 数 输 出 反 汇 编 信 息 需 要 
Debug 或 者 FastDebug 版 的 虚拟 机 才能 直接 支持 ， 如 果 使 用 Product 版 的 
虚拟 机 ， 则 需要 加 入 参数 -XX:+UnlockDiagnosticVMOptions 打 开 虚 拟 机 
诊断 模式 后 才能 使 用 。 


如 果 除 了 本 地 代码 的 生成 结果 外 ， 还 想 再 进一步 跟踪 本 地 代码 生 
成 的 具体 过 程 ， 那 还 可 以 使 用 参数 -XX:+PrintCFGToFile (使 用 Client 


Compiler) 或 -XX:PrintIdealGraphFile (使 用 Server Compiler) 令 虚 拟 机 
将 编译 过 程 中 各 个 阶段 的 数据 (例如 ， 对 Cl 编译 器 来 说 ， 包 括 字 节 
码 、HIR 生 成 、LIR 生 成 、 寄 存 器 分 配 过 程 、 本 地 代码 生成 等 数据 ) 输 
出 到 文件 中 。 然 后 使 用 Java HotSpot Client Compiler Visualizers| (用 于 
分 析 Client Compiler) 或 Ideal Graph Visualizer[4 (用 于 分 析 Server 
Compiler) 打开 这 些 数据 文件 进行 分 析 。 以 Server Compiler 为 例 ， 笔 者 
分 析 一 下 JIT 编 译 器 的 代码 生成 过 程 。 


Server Compiler 的 中 间 代 码 表示 是 一 种 名 为 Ideal 的 SSA 形 式 程序 依 
赖 图 (Program Dependence Graph) ， 在 运行 Java 程 序 的 JVM 参 数 中 加 
入 "-XX:PrintIdealGraphLevel=2-XX:PrintIdealGraphFile=ideal.xml"， 编 
译 后 将 产生 一 个 名 为 deal.xml 的 文件 ， 它 包含 了 Server Compiler 编 译 代 
码 的 过 程 信息 ， 可 以 使 用 Ideal Graph Visualizer 对 这 些 信息 进行 分 析 。 


Ideal Graph Visualizer 加 载 ideal.xml 文 件 后 ， 在 Outline 面 板 上 将 显示 
程序 运行 过 程 中 编译 过 的 方法 列表 ， 如 图 11-5 所 示 。 这 里 列 出 的 方法 是 
代码 清单 11-2 中 的 测试 代码 ， 其 中 doubleValue() 方 法 出 现 了 两 次 ， 这 是 
由 于 该 方法 的 编译 结果 存在 标准 编译 和 OSR 编 译 两 个 版 本 。 在 代码 清 
单 11-2 中 ， 笔 者 特别 为 doublevalue() 方 法 增加 了 一 个 空 循环 ， 这 个 循环 
对 方法 的 运算 结果 不 会 产生 影响 ， 但 如 果 没 有 任何 优化 ， 执 行 空 循环 
会 占用 CPU 时 间 ， 到 今天 还 有 许多 程序 设计 的 入 门 教程 把 空 循环 当做 


程序 延 时 的 手段 来 介绍 ， 在 Java 中 这 样 的 做 法 真 的 能 起 到 延 时 的 作用 
13? 


V Receive when name contains | | 


Pp | virtual jchar java.lang.String.charAt(jinb) 

> static jint org.fenixsoft.Test3.doubleValue(jint) 
‘~Y After Parsing 
几 lter GVN 1 


PhaseldeallLoop 1 
PhaseCPP 1 


3 lter GVN 2 

Optimize finished 

~ Before Matching 

所 Global code motion 

~ Final Code 

static jint org.fenixsoft.Test3.doubleValuel(jint) 
static jlong org.fenixsoft.Test3.calcSum() 


图 11-5 编译 过 的 方法 列表 


展开 方法 根 节 点 ， 可 以 看 到 下 面 罗 列 了 方法 优化 过 程 的 各 个 阶段 
(根据 优化 措施 的 不 同 ， 每 个 方法 所 经 过 的 阶段 也 会 有 所 差别 ) 的 

Ideal 图 ， 我 们 先 打 开 "After Parsing" 这 个 阶段 %* 上 文 提 到 ，JIT 编 译 器 在 
编译 一 个 Java 方 法 时 ， 首 先 要 把 字 市 码 解析 成 某 种 中 间 表 示 形 式 ， 然 后 
才 可 以 继续 做 分 析 和 优化 ， 最 终生 成 代码 。"After Parsing" 就 是 Server 
Compiler 刚 完成 解析 ， 还 没有 做 任何 优化 时 的 Ideal 图 表示 。 在 打开 这 个 
图 后 ， 读 者 会 看 到 其 中 有 很 多 有 颜色 的 方块 ， 如 图 11-6 所 示 。 每 一 个 方 
块 就 代表 了 一 个 程序 的 基本 块 (Basic Block) ， 基 本 块 的 特点 是 只 有 唯 


一 的 一 个 入 口 和 唯一 的 一 个 出 口 ， 只 要 基本 块 中 第 一 条 指令 执行 了 ， 
那么 基本 块 内 所 有 执行 都 会 按照 顺序 仅 执行 一 次 。 


代码 清早 11-2 的 doubleValue() 方 法 虽然 只 有 们 单 的 两 行 子 ， 但 是 按 
基本 块 划分 后 ， 形 成 的 图 形 结构 要 比 想 象 中 复杂 得 多 ， 这 一 方面 症 要 
满足 Java 语 言 所 定义 的 安全 需要 (如 类 型 安全 、 空 指针 检查 ) 和 Java 虚 
拟 机 的 运作 需要 (如 Safepoint 轮 询 ) ， 男 一 方面 是 由 于 有 些 程序 代码 中 
一 行 语句 就 可 能 形成 好 几 个 基本 块 (例如 循环 ) 。 对 于 例子 中 的 
doubleValue() 方 法 ， 如 采 忽 上 略语 言 安 全 检查 的 基本 块 ， 可 以 简单 理解 为 
按 顺序 执行 了 以 下 几 件 事 情 : 


1) 程序 入 口 ， 建 立 栈 帧 。 

2) 设置 j=0， 进 行 Safepoint 轮 询 ， 跳 转 到 4) 的 条 件 检查 。 
3) ji 

4) 条 件 检 查 ， 如 果 j<100000， 跳 转 到 3) 。 


5) 设置 i=i*2， 进 行 Safepoint 轮 询 ， 画 数 返 回 。 


图 11-6 基本 块 图 示 (1) 


以 上 几 个 步 双 ， 反 映 到 Ideal Graph Visualizer 的 图 上 ， 就 是 如 图 11-7 
所 示 的 内 容 。 这 样 我 们 要 看 空 循环 是 否 优化 ， 或 者 何 时 优化 ， 只 要 观 
察 代 表 循 环 的 基本 块 是 否 消除 ， 或 者 何 时 消除 束 可 以 了 。 


要 观察 到 这 一 点 ， 可 以 在 Outline 面 板 上 右键 点 击 "Difference to 
current graph"， 让 软件 自动 分 析 指 定 阶段 与 当前 打开 的 ldeal 图 之 间 的 差 


异 ， 如 采 基 本 块 被 宵 除 了 ， 将 会 以 红色 显示 。 对 "After 
Parsing" 和 "PhaseIdealLoop 1" 阶 段 的 Ideal 图 进行 差异 分 析 ， 发 现 

在 "PhaseIdealLoop 1" 阶 段 循环 操作 被 消除 了 ， 如 图 11-8 所 示 ， 这 也 就 说 
明 空 循环 实际 上 是 不 会 被 执行 的 。 


86 Retum 


图 11-7 基本 块 图 示 (2) 


» 0D virtual jchar java.lang.String.charAt(jint) 
™ 也 static jint org.fenixsoft.Test3.doubleValue(jint) 
S| After Parsing 


S| Before Matching 

这 | Global code motion 

语 ] Final Code 
» 区 static jint org.fenixsoftTest3.doublevalue(jint 
四 static jlong org.fenixsoft.Test3.calcSum() 


图 11-8 基本 块 图 示 (3) 


从 "After Parsing" 阶 段 开 始 ， 一 直到 最 后 的 "Final Code" 阶 段 ， 可 以 
看 到 doubleValue() 方 法 的 Ideal 图 从 繁 到 人 简 的 变迁 过 程 ， 这 也 是 Java 虚 拟 
机 在 尽力 优化 代码 的 过 程 。 到 了 最 后 的 "Final Code" 阶 段 ， 不 仅 空 循环 
的 开销 消除 了 ， 许 多 语言 安全 和 Safepoint 轮 询 的 操作 也 一 起 消除 了 ， 因 
为 编译 器 判断 即使 不 做 这 些 安全 保障 ， 虚 拟 机 也 不 会 受到 威胁 。 


最 后 提醒 一 下 读者 ， 要 输出 CFG 或 1dealGraph 文 件 ， 需 要 一 个 
Debug 版 或 FastDebug 版 的 虚拟 机 支持 ，Product 版 的 虚拟 机 无 法 输出 这 
2 


[1] 相 人 信 已 

http://wikis.sun.com/display/HotSpotInternals/PrintAssembly ° 

[2]HSDIS 的 源码 可 以 从 以 下 地 址 获取 

http://hg.openjdk.java.net/jdk7/hotspot/hotspot/file/tip/src/share/tools/hsdis/ 
。 另外， 相关 网 站 可 以 下 载 一 个 已 经 编译 好 了 的 适合 32 位 80x86 平 台 使 

用 的 反 汇 编 适 配器 ， 如 在 ITeye 的 高 级 语言 虚拟 机 圈子 的 共享 区 
(http://hllvm.group.iteye.com/group/share) 中 可 以 下 载 。 


[3] 官 方 站 点 : http://java.net/projects/clvisualizer/。 
[4] 官 方 站 点 : http://ssw.jku.at/General/Staff/TW/igv.html 。 


11.3 ”编译 优化 技术 


Java 程 序 员 有 一 个 共识 ， 以 编译 方式 执行 本 地 代码 比 解释 方式 更 
快 ， 之 所 以 有 这 样 的 共识 ， 除 去 虚拟 机 解释 执行 子 广 码 时 额外 消耗 时 
间 的 原因 外 ， 还 有 一 个 很 重要 的 原因 吏 是 虚拟 机 设计 团队 几乎 把 对 代 
码 的 所 有 优化 措施 都 集中 在 了 即时 编译 器 之 中 (在 JDK 1.3 之 后 ，Javac 
束 去 除了 -O 远 项 ， 不 会 生成 任何 字 市 码 级 别 的 优化 代码 了 ) ， 因 此 一 
般 来 说 ， 即 时 编译 万 产 生 的 本 地 代码 会 比 Javac 产 生 的 字 玫 码 更 加 优秀 
中 。 下 面 ， 笔 者 将 介绍 一 些 HotSpot 虚 拟 机 的 即时 编译 器 在 生成 代码 时 
采用 的 代码 优化 技术 。 


11.3.1 优化 技术 概览 


在 Sun 官 方 的 Wiki 上 ，HotSpot 虚 拟 机 设计 团队 列 出 了 一 个 相对 比较 
全 面 的 、 在 即时 编译 器 中 采用 的 优化 技术 列表 [站 ( 见 表 11-1) ， 其 中 有 
不 少 经 典 编译 器 的 优化 手段 ， 也 有 许多 针对 Java 语 言 (准确 地 说 是 针对 
运行 在 Java 虚 拟 机 上 的 所 有 语言 ) 本身 进行 的 优化 技术 ， 本 市 将 对 这 些 
技术 进行 概括 性 的 介绍 ， 在 后 面 几 节 中 ， 再 挑选 若干 重要 且 典 型 的 优 
化 ， 与 读者 一 起 看 看 优化 前 后 的 代码 产生 了 怎样 的 变化 。 


编译 器 策略 


(compiler tactics) 


基于 性 能 监控 的 优化 技术 


(profile-based techniques ) 


基于 证 据 的 优化 技术 


(proof-based techniques) 


表 11-1 


即时 编译 器 优化 技术 一 览 


优化 技术 
延迟 编译 〈delayed compilation ) 
分 层 编译 (tiered compilation ) 
栈 上 蔡 换 (on-stack replacement) 
延迟 优化 (delayed reoptimization) 
程序 依赖 图 表示 (program dependence graph representation ) 
静态 单 赋值 表示 (static single assignment representation ) 
乐观 空 值 断言 (optimistic nullness assertions) 
乐观 类 型 断言 (optimistic type assertions) 
乐观 类 型 增强 (optimistic type strengthening ) 
乐观 数组 长 度 增强 (optimistic array length strengthening ) 
裁剪 未 被 选择 的 分 支 《untaken branch pruning ) 
乐观 的 多 态 内 联 (optimistic N-morphic inlining ) 
分 支 频 率 预 测 (branch frequency prediction ) 
调用 频率 预测 (call frequency prediction ) 
精确 类 型 推断 (exact type inference) 
内 存 值 推 新 (memory value inference) 
内 存 值 跟踪 (memory value tracking ) 
常量 折合 (constant folding ) 
重组 (reassociation) 
操作 符 退 化 (operator strength reduction) 
空 值 检查 消除 (null check elimination) 
类 型 检测 退化 (type test strength reduction) 
类 型 检测 消除 (type test elimination) 
代数 化 简 (algebraic simplification) 
公共 子 表达 式 消除 (common subexpression elimination ) 


类 型 
数据 流 敏感 重 写 


(flow-sensitive rewrites ) 


语言 相关 的 优化 技术 


(language-specific techniques) 


内 存 及 代码 位 置 变换 


(memory and placement transformation ) 


循环 变换 


(loop transformations ) 


全 局 代码 调整 
(global code shaping ) 


控制 流 图 变换 


(control flow graph transformation ) 


优化 技术 
条 件 常 量 传 播 (conditional constant propagation) 
基于 流 承载 的 类 型 缩减 转换 (flow-carried type narrowing ) 
无 用 代码 消除 (dead code elimination ) 
类 型 继承 关系 分 析 (class hierarchy analysis) 
去 虚拟 机 化 《devirtualization 》 
符号 常量 传播 (symbolic constant propagation ) 
自动 装 箱 消除 Cautobox elimination ) 
逃逸 分 析 (escape analysis) 
锁 消 除 《lock elision) 
锁 膨 胀 (lock coarsening) 
消除 反射 (de-reflection) 
表达 式 提 升 【expression hoisting ) 
表达 式 下 沉 (expression sinking) 
元 余 存储 消除 ‘redundant store elimination ) 
相 邻 存储 合并 (adjacent store fusion) 
交汇 点 分 离 (merge-point splitting ) 
循环 展开 loop unrolling) 
循环 剥离 (loop peeling) 
安全 点 消除 (safepoint elimination ) 
挝 代 范 围 分 离 (iteration range splitting ) 
范围 检查 消除 (range check elimination ) 
循环 向量 化 〈loop vectorization) 
内 联 (inlining) 
全 局 代码 外 提 (global code motion ) 
基于 热度 的 代码 布局 (heat-based code layout) 
Switch 调整 (switch balancing) 
本 地 代码 编排 (local code scheduling) 
本 地 代码 封包 (local code bundling) 
延迟 楼 填充 (delay slot filling) 
着 色 图 寄存 器 分 配 (graph-coloring register allocation) 
线性 扫描 寄存 器 分 配 (linear scan register allocation ) 
复写 聚合 (copy coalescing) 
常量 分 列 (constant splitting ) 
复写 移 除 (copy removal) 
地 址 模式 匹配 (address mode matching) 
指令 宇 孔 优化 〈instruction peepholing) 
基于 确定 有 限 状态 机 的 代码 生成 (DFA-based code generator) 


上 述 的 优化 技术 看 起 来 很 多 ， 而 且 从 名 字 看 都 显得 有 点 “高 深 莫 
测 ”， 虽 然 实 现 这 些 优化 也 许 确 实 有 些 难 度 ， 但 大 部 分 技术 理解 起 来 都 
并 不 困难 。 为 了 消除 读者 对 这 些 优 化 技术 的 陌生 感 ， 笔 者 举 一 个 简单 
的 例子 ， 即 通过 大 家 熟悉 的 Java 代 码 变化 来 展示 其 中 几 种 优化 技术 是 如 
何 发 挥 作用 的 〈 仅 使 用 Java 代 码 来 表示 而 已 ) 。 首 先 从 原始 代码 开始 ， 
如 代码 清单 11-6 所 示 D 。 


代码 清单 11-6 ”优化 前 的 原始 代码 


static class B{ 
int Value; 

final int get()t{ 
return Value; 


} 
public void foo(){ 
y=b ,get( ); 


首先 需要 明确 的 是 ， 这 些 代码 优化 变换 是 建立 在 代码 的 某 种 中 间 
表示 或 机 器 码 之 上 ， 绝 不 是 建立 在 Java 源 码 之 上 的 ， 为 了 展示 方便 ， 笔 
者 使 用 了 Java 语 言 的 语法 来 表示 这 些 优化 技术 所 发 挥 的 作用 。 


代码 清单 11-6 的 代码 已 经 非 营 简单 了 ， 但 是 仍 有 许多 优化 的 余地 。 
第 一 步 进行 方法 内 联 (Method Inlining) ， 方 法 内 联 的 重要 性 要 高 于 其 
他 优化 措施 ， 它 的 主要 目的 有 两 个 ， 一 是 去 除 方法 调用 的 成 本 (如 建 


立 栈 帧 等 ) ， 二 是 为 其 他 优化 建立 展 好 的 基础 ， 方 法 内 联 膨胀 之 后 可 
以 便于 在 更 大 范围 上 采取 后 续 的 优化 手段 ， 从 而 获取 更 好 的 优化 效 
果 。 因 此 ， 各 种 编译 器 一 般 都 会 把 内 联 优 化 放 在 优化 序列 的 最 靠 前 位 
置 。 内 联 后 的 代码 如 代码 清单 11-7 所 示 。 


代码 清单 11-7 内 联 后 的 代码 


public void foo(){ 
y=b .Value; 


第 二 步 进 行 见 余 访问 消除 (Redundant Loads Elimination) ， 假 设 
代码 中 间 注 释 掉 的 "dostuff.…..." 所 代表 的 操作 不 会 改变 b.value 的 值 ， 那 
束 可 以 把 "z=b.value" 蔡 换 为 "z=y"， 因 为 上 一 句 "y=b.value" 已 经 你 证 了 变 
量 y 与 b.value 是 一 致 的 ， 这 样 就 可 以 不 再 去 访问 对 象 b 的 局 部 变量 了 。 
如 果 把 b.value 看 做 是 一 个 表达 式 ， 那 也 可 以 把 这 项 优化 看 成 是 公共 子 
表达 式 消除 (Common Subexpression Elimination) ， 优 化 后 的 代码 如 代 
码 清 单 11-8 所 示 。 


代码 清单 11-8 元 余 存 储 消 除 的 代码 


public void foo(){ 
y=b .Value; 

/ [ddO stuff..... 
Z=Yy; 

SuUm=y+Z; 


第 三 步 我 们 进行 复写 传播 (Copy Propagation) ， 因 为 在 这 段 程序 
的 逻辑 中 并 没有 必要 使 用 一 个 额外 的 变量 "z"， 它 与 变量 "y" 是 完全 相等 
的 ， 因 此 可 以 使 用 "y" 来 代替 "z"。 复 写 传播 之 后 程序 如 代码 清单 11-9 所 


修 ° 


代码 清单 11-9 ”复写 传播 的 代码 


public void foo(){ 
y=b .Value; 

/ [ddO stuff..... 
y=y ; 

sum=y+y:; 


第 四 步 我 们 进行 无 用 代码 消除 (Dead Code Elimination) 。 无 用 代 
pA 
到 


码 可 能 是 永远 不 会 被 执行 的 代码 ， 也 可 能 是 完全 没有 意义 的 代码 ， 
此 ， 它 又 形象 地 称 为 "Dead Code"， 在 代码 清单 11-9 中 ，"y=y" 是 没有 意 


义 的 ， 把 它 消 除 后 的 程序 如 代码 清单 11-10 所 示 。 
代码 清单 11-10 ”进行 无 用 代码 消除 的 代码 


public void foo(){ 
y=b .Value; 

/ /doO stuff..... 
sum=y+y:; 


经 过 四 次 优化 之 后 ， 代 码 清单 11-10 与 代码 清单 11-6 所 达到 的 效果 
是 一 致 的 ， 但 是 前 者 比 后 者 省 略 了 许多 语句 〈 体 现在 字 节 码 和 机 器 码 
和 令 上 的 差距 会 更 大 ) ， 执 行 效率 也 会 更 高 。 编 译 器 的 这 些 优化 技术 
实现 起 来 也 许 比 较 复 杂 ， 但 是 要 理解 它们 的 行为 对 于 一 个 普通 的 程序 
员 来 说 是 没有 困难 的 ， 接 下 来 ， 我 们 将 继续 得 看 如 下 的 几 项 最 有 代表 
性 的 优化 技术 是 如 何 运作 的 ， 它 们 分 别 是 : 


语言 无 关 的 经 典 优化 技术 之 一 :公共 子 表达 式 消除 。 
语言 相关 的 经 典 优化 技术 之 一 : 数组 范围 检查 消除 。 
最 重要 的 优化 技术 之 一 方法 内 联 。 
最 前 沿 的 优化 技术 之 一 ， 逃逸 分 析 。 


[本 地 代码 与 字 世 码 两 者 是 无 法 直接 比较 的 ， 准 确 地 说 应 当 是 指 : 由 
编译 器 优化 得 到 的 本 地 代码 与 由 解释 器 解释 字 节 码 后 实际 执行 的 本 地 
代码 之 间 的 对 比 。 


[2] 地 址 
http://wikis.sun.com/display/HotSpotInternals/PerformanceTacticIndex ° 
加 本 例 修 改 目 


http://download.oracle.com/docs/cd/E13150_01/jrockit_jvm/jrockit/geninfo/ 


diagnos/underst_jit.html ° 


1132 于 本 


公共 子 表达 式 消 除 是 一 个 普遍 应 用 于 各 种 编译 器 的 经 典 优化 技 
术 ， 它 的 含义 是 : 如 果 一 个 表达 式 E 已 经 计算 过 了 ， 并 且 从 先前 的 计 
算 到 现在 E 中 所 有 变量 的 值 都 没有 发 生变 化 ， 那 么 E 的 这 次 出 现 就 成 为 
了 公共 子 表 达 式 。 对 于 这 种 表达 式 ， 没 有 必要 花 时 间 再 对 它 进行 计 
算 ， 只 需要 直接 用 前 面 计算 过 的 表达 式 结 果 代替 E 就 可 以 了 。 如 果 这 
种 优化 仅 限 于 程序 的 基本 块 内 ， 便 称 为 局 部 公共 子 表达 式 消 除 (Local 
Common Subexpression Elimination) ， 如 果 这 种 优化 的 范围 涵盖 了 多 
个 基本 块 ， 那 就 称 为 全 局 公共 子 表 达 式 消除 《Global Common 
Subexpression Elimination) 。 举 个 简单 的 例子 来 说 明 它 的 优化 过 程 ， 
假设 存在 如 下 代码 : 


int d= (c * b) *12+a+ (a+b * C) ; 


如 果 这 上 段 代 码 交 给 Javac 编 译 絮 则 不 会 进行 任何 优化 ， 那 生成 的 代 
码 将 如 代码 清单 11-11 所 示 ， 是 完全 遵照 Java 源 码 的 写法 直译 而 成 的 。 


代码 清单 11-11 未 做 任何 优化 的 了 市 码 


iload 2//b 
imul// 计 算 b * c 
bipush 12// 推 入 12 
imul// 计 算 (c * b) *12 
iload_ 1//a 


iadd// 计算 (c * b) *12+a 

iload 1//a 

iload 2//b 

iload_ 3//c 

imul// 计 算 pb * c 

iadd// 计 算 atb * c 

iadd// 计 算 (c * b) *12+a+ (at+b * C) 
istore 4 


当 这 上 段 代码 进入 到 虚拟 机 即时 编译 器 后 ， 它 将 进行 如 下 优化 ， 编 
译 絮 检测 到 "c * b" 与 "b * c" 是 一 样 的 表达 式 ， 而 且 在 计算 期 间 b 与 c 的 值 
征 不 变 的 。 因 此 ， 这 条 表达 式 吕 可 能 被 视 为 : 


int d=E*12+a+ (a+E) ; 


这 时 ， 编 译 器 还 可 能 (取决 于 哪 种 虚拟 机 的 编译 器 以 及 具体 的 上 
下 文 而 定 ) 进行 另外 一 种 优化 : 代数 化 简 (Algebraic 
Simplification) ， 把 表达 式 变 为 : 


int d=E*13+a*2; 


表达 式 进 行 变 换 之 后 ， 再 计算 起 来 惑 可 以 节省 一 些 时 间 了 “。 如 采 
读者 还 对 其 他 的 经 典 编译 优化 技术 感 兴趣 ， 可 以 参考 《编译 原理 》 
(俗称 “ 龙 书 ”， 推 荐 使 用 Java 的 程序 员 阅 读 2006 年 版 的 * 紫 龙 书 2) 中 
的 相关 章节 。 


11.3.3 ”数组 边界 检查 消除 


数组 边界 检查 消除 (Array Bounds Checking Elimination) 是 即时 
编译 器 中 的 一 项 语言 相关 的 经 典 优化 技术 。 我 们 知道 Java 语 言 是 一 门 
动态 安全 的 语言 ， 对 数组 的 读 写 访问 也 不 像 C、C++ 那 样 在 本 质 上 是 裸 
指针 操作 。 如 采 有 一 个 数组 foo[]， 在 Java 语 言 中 访问 数组 元 素 foo[j] 的 
时 候 系统 将 会 自动 进行 上 下 界 的 范围 检查 ， 即 检查 i 必 须 满 足 i> =0 儿 
尺 i<foo.length 这 个 条 件 ， 否 则 将 抛 出 一 个 运行 时 异常 : 
java.lang.ArrayIndexOutOfBoundsException。 这 对 软件 开发 者 来 说 是 一 
件 很 好 的 事情 ， 即 使 程序 员 没 有 专门 编写 防御 代码 ， 也 可 以 避免 大 部 
分 的 溢出 攻击 。 但 是 对 于 虚拟 机 的 执行 子 系统 来 说 ， 每 次 数组 元 素 的 
读 写 都 党 有 一 次 隐 伟 的 条 件 判定 操作 ， 对 于 拥有 大 量 数组 访问 的 程序 
代码 ， 这 无 疑 也 是 一 种 性 能 负担 。 


无 论 如 何 ， 为 了 安全 ， 数 组 边界 检查 肯定 是 必须 做 的 ， 但 数组 边 
界 检 查 是 不 是 必须 在 运行 期 间 一 次 不 调 地 检查 则 是 可 以 “商量 ”的 事 

情 。 例 如 下 面 这 个 位 单 的 情况 ， 数组 下 标 是 一 个 常量 ， 如 foo[3]， 只 
在 编译 期 根据 数据 流 分 析 来 确定 foo.length 的 值 ， 并 判断 下 标 “3” 没 有 越 
界 ， 执 行 的 时 候 束 无 须 判 断 了 。 更 加 第 见 的 情况 是 数组 访问 发 生 在 循 
环 之 中 ， 并 且 使 用 循环 变量 来 进行 数组 访问 ， 如 果 编 译 侣 只 要 通过 数 
据 流 分 析 束 可 以 判定 循环 变量 的 取 值 范围 永远 在 区 间 [0，foo.length) 


之 内 ， 那 在 整个 循环 中 就 可 以 把 数组 的 上 下 界 检 查 消除 ， 这 可 以 太 省 
很 多 次 的 条 件 判断 操作 。 


将 这 个 数组 边界 检查 的 例子 放 在 更 高 的 角度 来 看 ， 大 量 的 安全 检 
查 令 编写 Java 程 序 比 编写 C/C++ 程 序 容易 很 多 ， 如 数组 越界 会 得 到 


ArrayIndexOutOfBoundsException 异 常 ， 空 指针 访问 会 得 到 


NullPointException， 除 数 为 零 会 得 到 ArithmeticException 等 ， 在 
C/C++ 程 序 中 出 现 类 似 的 问题 ， 一 不 小 心 承 会 出 现 Segment Fault 信 号 
或 者 Window 编 程 中 常见 的 “xxx 内 存 不 能 为 Read/Write” 之 类 的 提示 ， 处 
理 不 好 程序 就 直接 衣 溃 退出 了 。 但 这 些 安全 检查 也 导致 了 相同 的 程 
序 ，Java 要 比 C/C++ 做 更 多 的 事情 (各 种 检查 判断 ，， 这 些 事 情 就 成 为 
一 种 隐 式 开销 ， 如 果 人 处 理 不 好 它们 ， 就 很 可 能 成 为 一 个 Java 语 言 比 
C/C++ 更 慢 的 因素 。 要 消除 这 些 隐 式 开销 ， 除 了 如 数组 边界 检查 优化 
这 种 尽 可 能 把 运行 期 检查 提 到 编译 期 完成 的 思路 之 外 ， 男 外 还 有 一 种 
避免 思路 一 一 隐 式 异常 处 理 ，Java 中 空 指针 检查 和 算术 运算 中 除数 为 
零 的 检查 都 采用 了 这 种 思路 。 举 个 例子 ， 例 如 程序 中 访问 一 个 对 象 

〈 假 设 对 象 叫 foo) 的 某 个 属性 〈 假 设 属性 叫 value) ， 那 以 Java 伪 代码 
来 表示 虚拟 机 访问 foo.value 的 过 程 如 下 。 


if (foo!=null) { 

return foo.value; 

}elsef{ 

throw new NullPointException(); 


} 


在 使 用 隐 式 异常 优化 之 后 ， 虚 拟 机 会 把 上 面 伪 代 码 所 表示 的 访问 
过 程 变 为 如 下 伪 代 码 。 
tryt{ 
return foo.value:; 


}catch (segment fault) { 
uncommon_trap(); 


虚拟 机 会 注册 一 个 Segment Fault 信 号 的 异常 处 理 器 【( 伪 代 码 中 的 
uncommon_trap()) ， 这 样 当 foo 不 为 空 的 时 候 ， 对 value 的 访问 是 不 会 
额外 消耗 一 次 对 foo 判 至 的 开销 的 。 代 价 束 是 当 foo 真 的 为 空 时 ， 必 须 
转 入 到 异常 处 理 器 中 恢复 并 抛 出 NullPointException 寞 常 ， 这 个 过 程 必 
须 从 用 户 态 转 到 内 核 仿 中 处 理 ， 绪 束 后 再 回 到 用 户 态 ， 速 度 远 比 一 次 
判 空 检查 慢 。 当 foo 极 少 为 空 的 时 候 ， 隐 式 异 党 优化 是 值得 的 ， 但 假如 
foo 经 党 为 空 的 话 ， 这 样 的 优化 反而 会 让 程序 更 慢 ， 还 好 HotSpot 虚 拟 
机 足够 “聪明 ”， 它 会 根据 运行 期 收集 到 的 Profile 信 息 目 动 选择 最 优 方 


案 。 


与 语言 相关 的 其 他 消除 操作 还 有 不 少 ， 如 自动 装 箱 消除 (Autobox 
Elimination) 、 安 全 点 消除 (Safepoint Elimination) 、 消 除 反射 


(Dereflection) 等 ， 笔 者 就 不 再 一 一 介绍 了 。 


We 方 放 内 联 


在 前 面 的 讲解 之 中 我 们 提 到 过 方法 内 联 ， 它 是 编译 器 最 重要 的 优 
化 手段 之 一 ， 除 了 消除 方法 调用 的 成 本 之 外 ， 它 更 重要 的 意义 是 为 其 
他 优化 手段 建立 良好 的 基础 ， 如 代码 清单 11-12 所 示 的 简单 例子 就 揭示 
了 内 联 对 其 他 优化 手段 的 意义 : 事实 上 testInline() 方 法 的 内 部 全 部 都 是 
无 用 的 代码 ， 如 果 不 做 内 联 ， 后 续 即 使 进行 了 无 用 代码 消除 的 优化 ， 
也 无 法 发 现任 何 "Dead Code"， 因 为 如 果 分 开 来 看 ，foo() 和 testInline() 
两 个 方法 里 面 的 操作 都 可 能 是 有 意义 的 。 


代码 清单 11-12 未 做 任何 优化 的 字 市 码 


public static void foo (Object obj) { 
if (obj!=null) { 
System.out.println ("do something") ; 


public static void testInline (String[]args) { 
Object obj=null; 

foo (obj) ; 

} 


方法 内 联 的 优化 行为 看 起 来 很 简单 ， 不 过 是 把 目标 方法 的 代码 “ 复 
制 ?到 发 起 调用 的 方法 之 中 ， 避 免 发 生 真实 的 方法 调用 而 已 。 但 实际 上 
Java 虚 拟 机 中 的 内 联 过 程 远 远 没有 那么 简单 ， 因 为 如 条 不 是 即时 编译 


右 做 了 一 些 特别 的 努力 ， 按 照 经 典 编译 原理 的 优化 理论 ， 大 多 数 的 
Java 方 法 都 无 法 进行 内 联 。 


无 法 内 联 的 原因 其 实在 第 8 章 中 讲解 Java 方 法 解析 和 分 派 调用 的 时 
候 就 已 经 介绍 过 。 只 有 使 用 invokespecial 指 令 调 用 的 私有 方法 、 实 例 构 
造 器 、 父 类 方法 以 及 使 用 invokestatic 指 令 进 行 调用 的 静态 方法 才 是 在 
编译 期 进行 解析 的 ， 除 了 上 述 4 种 方法 之 外 ， 其 他 的 Java 方 法 调用 都 需 
要 在 运行 时 进行 方法 接收 着 的 多 态 选择 ， 并 且 都 有 可 能 存在 多 于 一 个 
版 本 的 方法 接收 者 (最 多 再 除去 被 final 修 饰 的 方法 这 种 特殊 情况 ， 尽 
管 它 使 用 invokevirtual 指 令 调 用 ， 但 也 是 非 虚 方法 ，Java 语 言 规范 中 明 
确 说 明了 这 点 ) ， 简 而 言 之 ，Java 语 言 中 默认 的 实例 方法 是 虚 方法 。 


对 于 一 个 虚 方法 ， 编 译 期 做 内 联 的 时 候 根 本 无 法 确定 应 该 使 用 哪 
个 方法 版 本 ， 如 果 以 代码 清单 11-7 中 把 "b.get0" 内 联 为 "b.value" 为 例 的 
话 ， 就 是 不 依赖 上 下 文 就 无 法 确定 b 的 实际 类 型 是 什么 。 假 如 有 
ParentB 和 SubB 两 个 具有 继承 关系 的 类 ， 并 且 子 类 重 写 了 父 类 的 get() 方 
法 ,那么 ， 是 要 执行 父 类 的 get(0) 方 法 还 是 子 类 的 get() 方 法 ， 需 要 在 运 
行 期 才能 确定 ， 编 译 期 无 法 得 出 结论 。 


由 于 Java 语 言 提倡 使 用 面 回 对 象 的 编程 方式 进行 编程 ， 而 Java 对 
象 的 方法 默认 就 是 虚 方 法 ， 因 此 Java 间 接 鼓 励 了 程序 员 使 用 大 量 的 虚 
方法 来 完成 程序 逻辑 。 根 据 上 面 的 分 机 ， 如 采 内 联 与 虚 方法 之 间 产 


生 * 了 矛盾 ”， 那 该 怎么 办 呢 ? 是 不 是 为 了 提高 执行 性 能 ， 就 要 到 处 使 用 
final 关 键 字 去 修 锦 方法 呢 ? 


为 了 解决 虚 方 法 的 内 联 问题 ，Java 虚 拟 机 设计 团队 想 了 很 多 办 
法 ， 首 先是 引入 了 一 种 名 为 “类 型 继承 关系 分 析 ” (Class Hierarchy 
Analysis,CHA) 的 技术 ， 这 是 一 种 基于 整个 应 用 程序 的 类 型 分 析 技 
术 ， 它 用 于 确定 在 目前 已 加 载 的 类 中 ， 某 个 接口 是 否 有 多 于 一 种 的 实 
现 ， 某 个 类 是 否 存在 子 类 、 子 类 是 否 为 抽象 类 等 信息 。 


编译 右 在 进行 内 联 时 ， 如 果 是 非 虚 方 法 ， 那 么 直接 进行 内 联 束 可 
以 了 ， 这 时 候 的 内 联 征 有 稳定 前 提 保 障 的 。 如 采 遇 到 虚 方 法 ， 则 会 同 
CHA 碍 询 此 方法 在 当前 程序 下 是 否 有 多 个 目标 版 本 可 供 选 择 ， 如 采 碍 
询 结 采 只 有 一 个 版 本 ， 那 也 可 以 进行 内 联 ， 不 过 这 种 内 联 吏 属 于 激进 
优化 ， 需 要 预 留 一 个 “逃生 门 ”(Guard 条 件 不 成 立时 的 Slow Path) ， 称 
为 守护 内 联 (Guarded Inlining) 。 如 果 程 序 的 后 续 执 行 过 程 中 ， 虚 拟 
机 一 直 没 有 加 载 到 会 令 这 个 方法 的 接收 者 的 继承 关系 发 生变 化 的 类 ， 
那 这 个 内 联 优 化 的 代码 束 可 以 一 直 使 用 下 去 。 但 如 有 果 加 载 了 导致 继承 
关系 发 生变 化 的 新 类 ， 那 束 需 要 抛弃 已 经 编译 的 代码 ， 退 回 到 解释 状 
仿 执 行 ， 或 者 重新 进行 编译 。 


如 采 同 CHA 碍 询 出 来 的 结果 是 有 多 个 版 本 的 目标 方法 可 供 移 择 ， 
则 编译 器 还 将 会 进行 最 后 一 次 努力 ， 使 用 内 联 缓存 (Inline Cache) 来 
完成 方法 内 联 ， 这 征 一 个 建立 在 目标 方法 正常 入 口 之 前 的 缓存 ， 它 的 


工作 原理 大 致 是 : 在 未 发 生 方 法 调用 之 前 ， 内 联 缓存 状态 为 空 ， 当 第 
一 次 调用 发 生 后 ， 缓 存 记录 下 方法 接收 者 的 版 本 信息 ， 并 且 每 次 进行 
方法 调用 时 都 比较 接收 者 版 本 ， 如 有 果 以 后 进来 的 每 次 调用 的 方法 接收 
者 版 本 都 是 一 样 的 ， 那 这 个 内 联 还 可 以 一 直 用 下 去 。 如 采 发 生 了 方法 
接收 者 不 一 致 的 情况 ， 束 说 明 程序 真正 使 用 了 虚 方 法 的 多 仿 符 性 ， 这 
时 才 会 取消 内 联 ， 查 找 虚 方 法 表 进行 方 法 分 派 。 


所 以 说 ， 在 许多 情况 下 虚拟 机 进行 的 内 联 都 是 一 种 激进 优化 ， 激 
进 优化 的 手段 在 高 性 能 的 商用 虚拟 机 中 很 常见 ， 除 了 内 联 之 外 ， 对 于 
出 现 概 率 很 小 (通过 经 验 数 据 或 解释 器 收集 到 的 性 能 监控 信息 确定 概 
率 大 小 ) 的 隐 式 异常 、 使 用 概率 很 小 的 分 支 等 都 可 以 被 激进 优化 “ 移 
除 ”"， 如 果真 的 出 现 了 小 概率 事件 ， 这 时 才 会 从 “逃生 [|]” 回 到 解释 状态 
重新 执行 。 


11.3.5 ”逃逸 分 析 


逃逸 分 析 (Escape Analysis) 是 目前 Java 虚 拟 机 中 比较 前 沿 的 优化 
技术 ， 它 与 类 型 继承 关系 分 析 一 样 ， 并 不 是 直接 优化 代码 的 手段 ， 而 
是 为 其 他 优化 手段 提供 依据 的 分 析 技 术 。 


逃逸 分 析 的 基本 行为 束 是 分 析 对 象 动态 作用 域 : 当 一 个 对 象 在 方 
法 中 被 定义 后 ， 它 可 能 被 外 部 方法 所 引用 ， 例 如 作为 调用 参数 传递 到 
其 他 方法 中 ， 称 为 方法 逃 了 速 。 甚 至 还 有 可 能 被 外 部 线程 访问 到 ， 璧 如 
赋值 给 类 变量 或 可 以 在 其 他 线程 中 访问 的 实例 变量 ， 称 为 线程 逃逸 。 


如 宁 能 证 明 一 个 对 象 不 会 逃逸 到 方法 或 线程 之 外 ， 也 吏 是 别 的 方 
法 或 线程 无 法 通过 任何 途径 访问 到 这 个 对 象 ， 则 可 能 为 这 个 变量 进行 
一 些 高 效 的 优化 ， 如 下 所 示 。 


栈 上 分 配 (Stack Allocation) : Java 虚 拟 机 中 ， 在 Java 堆 上 分 配 创 
建 对 象 的 内 存 空间 几乎 是 Java 程 序 员 都 清楚 的 常识 了 ，Java 扒 中 的 对 
象 对 于 各 个 线程 都 是 共享 和 可 见 的 ， 只 要 持 有 这 个 对 象 的 引用 ， 就 可 
以 访问 堆 中 存储 的 对 象 数据 。 虚 拟 机 的 垃圾 收集 系统 可 以 回收 堆 中 不 
再 使 用 的 对 象 ， 但 回收 动作 无 论 是 筛选 可 回收 对 象 ， 还 是 回收 和 整理 
内 存 都 需要 耗费 时 间 。 如 果 确 定 一 个 对 象 不 会 逃逸 出 方法 之 外 ， 那 让 
这 个 对 象 在 栈 上 分 配 内 存 将 会 是 一 个 很 不 错 的 主 章 ， 对 象 所 占用 的 内 


存 空间 殉 可 以 随 栈 帆 出 栈 而 销 又 。 在 一 般 应 用 中 ， 不 会 逃 束 的 局 部 对 
象 所 占 的 比例 很 大 ， 如 末 能 使 用 栈 上 分 配 ， 那 大 量 的 对 象 束 会 随 着 方 
法 的 结束 而 目 动 销 驱 了 ， 世 圾 收集 系统 的 压力 将 会 小 很 多 。 


同步 消除 (Synchronization Elimination) : 线程 同步 本 身 是 一 个 相 
对 耗 时 的 过 程 ， 如 果 逃 逸 分 析 能 够 确定 一 个 变量 不 会 逃逸 出 线程 ， 无 
法 被 其 他 线程 访问 ， 那 这 个 变量 的 读 写 上 表 定 就 不 会 有 竞争 ， 对 这 个 变 
量 实 施 的 同步 措施 也 就 可 以 消除 掉 。 


标量 替换 (Scalar Replacement) : 标量 (Scalar) 是 指 一 个 数据 已 
经 无 法 再 分 解 成 更 小 的 数据 来 表示 了 ，Java 虚 拟 机 中 的 原始 数据 类 型 
(int、long 等 数值 类 型 以 及 reference 类 型 等 ) 都 不 能 再 进一步 分 解 ， 
它们 束 可 以 称 为 标量 。 相 对 的 ， 如 有 果 一 个 数据 可 以 继续 分 解 ， 那 它 驶 
称 作 聚 合 量 (Aggregate) ，Java 中 的 对 象 就 是 最 典型 的 聚合 量 。 如 果 
把 一 个 Java 对 象 拆散 ， 根 据 程 序 访 问 的 情况 ， 将 其 使 用 到 的 成 员 变 量 
恢复 原始 类 型 来 访问 束 叫 做 标量 蔡 换 。 如 果 逃 逸 分 析 证 明 一 个 对 象 不 
会 锌 外 部 访问 ， 并 且 这 个 对 象 可 以 被 拆散 的 话 ， 那 程序 真正 执行 的 时 
候 将 可 能 不 创建 这 个 对 象 ， 而 改 为 直接 创建 它 的 春 干 个 被 这 个 方法 使 
用 到 的 成 员 变 量 来 代 奉 。 将 对 象 拆 分 后 ， 除 了 可 以 让 对 象 的 成 员 变 量 
在 栈 上 〈 栈 上 存储 的 数据 ， 有 很 大 的 概率 会 被 虚拟 机 分 配 至 物理 机 器 
的 高 速 寄存 器 中 存储 ) 分 配 和 读 写 之 外 ， 还 可 以 为 后 续 进 一 步 的 优化 
手段 创建 条 件 。 


关于 逃逸 分 析 的 论文 在 1999 年 就 已 经 发 表 ， 但 直到 Sun JDK 1.6 才 
实现 了 逃逸 分 析 ， 而 且 直 到 现在 这 项 优化 尚未 足够 成 熟 ， 仍 有 很 大 的 
改进 余地 。 不 成 熟 的 原因 主要 是 不 能 保证 逃逸 分 析 的 性 能 收益 必定 高 
于 它 的 消耗 。 如 果 要 完全 准确 地 判断 一 个 对 象 是 否 会 逃逸 ， 需 要 进行 
数据 流 敏感 的 一 系列 复杂 分 析 ， 从 而 确定 程序 各 个 分 支 执行 时 对 此 对 
象 的 影响 。 这 是 一 个 相对 高 耗 时 的 过 程 ， 如 果 分 析 完 后 发 现 没 有 几 个 
不 逃逸 的 对 象 ， 那 这 些 运行 期 耗 用 的 时 间 莽 日 日 浪费 了 ， 所 以 目前 虚 
拟 机 只 能 采用 不 那么 准确 ， 但 时 间 压 力 相 对 较 小 的 算法 来 完成 逃逸 分 
析 。 还 有 一 点 是 ， 基 于 逃逸 分 析 的 一 些 优化 手段 ， 如 上 面 提 到 的 “ 栈 上 
分 配 ”*”， 由 于 HotSpot 虚 拟 机 目前 的 实现 方式 导致 栈 上 分 配 实现 起 来 比 
较 复 杂 ， 因 此 在 HotSpot 中 和 暂时 还 没有 做 这 项 优化 。 


在 测试 结果 中 ， 实 施 逃 逸 分 析 后 的 程序 在 MicroBenchmarks 中 往往 
能 运行 出 不 错 的 成 绩 ， 但 是 在 实际 的 应 用 程序 ， 尤 其 是 大 型 程序 中 反 
而 发 现实 施 逃 逸 分 析 可 能 出 现 效果 不 稳定 的 情况 ， 或 因 分 析 过 程 耗 时 
但 却 无 法 有 效 判 别 出 非 逃逸 对 象 而 导致 性 能 (即时 编译 的 收益 ) 有 所 
下 降 ， 所 以 在 很 长 的 一 段 时 间 里 ， 即 使 是 Server Compiler， 也 默认 不 
开启 逃逸 分 析 巾 ， 甚 至 在 某 些 版 本 (如 JDK 1.6 Update 18) 中 还 曾经 


短暂 地 完全 禁止 了 这 项 优化 。 


如 有 果 有 需要， 并 且 确 认 对 程序 运行 有 益 ， 用 户 可 以 使 用 参数 - 
XX:+DoEscapeAnalysis 来 手动 开局 逃逸 分 析 ， 开 局 之 后 可 以 通过 参数 - 


XX:+PrintEscapeAnalysis 来 查看 分 析 结 果 。 有 了 逃逸 分 析 文 持 之 后 ， 
用 户 可 以 使 用 参数 -XX:+EliminateAllocations 来 开局 标量 替换 ， 使 用 
+XX:+EliminateLocks 来 开启 同步 消除 ， 使 用 参数 - 


XX:+PrintEliminateAllocations 查 看 标量 的 替换 情况 。 


尽管 目前 逃 侈 分 析 的 技术 仍 不 古 十 分 成 熟 ， 但 是 它 却 是 即时 编译 
厚 优 化 技术 的 一 个 重要 的 发 展 方向 ， 在 今后 的 虚拟 机 中 ， 逃 逸 分 析 技 
术 肯 定 会 文 撑 起 一 系列 实用 有 效 的 优化 技术 。 


[1] 在 JDK 1.6 Update 23 的 Server Compiler 中 才 开 始 默认 开局 了 逃逸 分 
析 。 


11.4 Java 与 C/C++ 的 编译 需 对 比 


大 多 数 程序 员 都 认为 C/C++ 会 比 Java 语 言 快 ， 甚 至 觉得 从 Java 语 言 
诞生 以 来 “执行 速度 绥 慢 ”的 帽子 束 应 当 扣 在 它 的 头顶 ， 这 种 观点 的 出 
现 是 由 于 Java 刚 出 现 的 时 候 即 时 编译 技术 还 不 成 熟 ， 主 要 靠 解 释 占 执 
行 的 Java 语 言 性 能 确实 比较 低下 。 但 目前 即时 编译 技术 已 经 十 分 成 
熟 ，Java 语 言 有 可 能 在 速度 上 与 C/C++ 一 争 高 下 吗 ? 要 想 知道 这 个 问题 
的 答案 ， 让 我 们 从 两 者 的 编译 器 谈 起 :1 。 


Java 与 C/C++ 的 编译 硕 对 比 实际 上 代表 了 最 经 典 的 即时 编译 需 与 静 
态 编译 器 的 对 比 ， 很 大 程度 上 也 决定 了 Java 与 C/C++ 的 性 能 对 比 的 结 
果 ， 因 为 无 论 是 C/C++ 还 十 Java 代 码 ， 最 终 编 译 之 后 被 机 絮 执 行 的 都 是 
本 地 机 絮 码 ， 哪 种 语言 的 性 能 更 高 ， 除 了 它们 目 映 的 API 库 实现 得 好 
坏 以 外 ， 其 余 的 比较 束 成 了 一 场 “ 拼 编译 右 ”" 和 “ 拼 输出 代码 质量 ”的 游 
戏 。 当 然 ， 这 种 比较 也 二 剔除 了 开发 效率 的 片面 对 比 ， 语 言 间 球 优 皂 
伪 、 谁 快 谁 慢 的 问题 都 是 很 难 有 结果 的 争论， 下 面 我 们 就 回 到 正题 ， 
看 看 这 两 种 语言 的 编译 器 各 有 何 种 优势 。 


Java 虚 拟 机 的 即时 编译 器 与 C/C++ 的 静态 优化 编译 器 相 比 ， 可 能 会 
由 于 下 列 这 些 原因 而 导致 输出 的 本 地 代码 有 一 些 和 劣势 (下面 列 举 的 也 
包括 一 些 虚 拟 机 执行 子 系统 的 性 能 劣势 ) : 


第 一 ， 因 为 即时 编译 亏 运 行 占用 的 是 用 户 程序 的 运行 时 间 ， 有 具有 
很 大 的 时 间 压 力 ， 它 能 提供 的 优化 手段 也 严重 受制 于 编译 成 本 。 如 采 
编译 速度 不 能 达到 要 求 ， 那 用 户 将 在 局 动 程序 或 程序 的 某 部 分 察觉 到 
重大 延迟 ， 这 点 使 得 即时 编译 万 不 敢 随 便 引 入 大 规模 的 优化 技术 ， 而 
编译 的 时 间 成 本 在 静态 优化 编译 器 中 并 不 是 主要 的 关注 点 。 


第 二 ，Java 语 言 是 动态 的 类 型 安全 语言 ， 这 束 意 味 着 需要 由 虚拟 
机 来 确保 程序 不 会 违反 语言 语义 或 访问 非 结 构 化 内 存 。 从 实现 层面 上 
看 ， 这 头 意味 着 虚拟 机 必须 频 迷 地 进行 动态 检查 ， 如 实例 方法 访问 时 
检查 至 指针 、 数 组 元 系 访 问 时 检查 上 下 界 范围 、 类 型 转换 时 检查 继承 
关系 等 。 对 于 这 类 程序 代码 没有 明确 写 出 的 检查 行为 ， 尽 管 编译 禹 会 
努力 进行 优化 ， 但 是 总 体 上 仍然 要 消耗 不 少 的 运行 时 间 。 


第 三 ，Java 语 言 中 虽然 没有 virtual 关 键 字 ， 但 是 使 用 虚 方 法 的 频率 
却 远 远 大 于 C/C++ 语 言 ， 这 意味 着 运行 时 对 方法 接收 者 进行 多 态 选 择 
的 频率 要 远 远 大 于 C/C++ 语言 ， 也 意味 着 即时 编译 带 在 进行 一 些 优化 
(如 前 面 提 到 的 方法 内 联 ) 时 的 难度 要 远大 于 C/C++ 的 静态 优化 编译 


第 四 ，Java 语 言 是 可 以 动态 扩展 的 语言 ， 运 行 时 加 载 狐 的 类 可 能 
改变 程序 类 型 的 继承 关系 ， 这 使 得 很 多 全 局 的 优化 都 难以 进行 ， 因 为 
编译 需 无 法 看 见 程序 的 全 入， 许多 全 局 的 优化 措施 都 只 能 以 激进 优化 


的 方式 来 完成 ， 编 译 器 不 得 不 时 刻 注意 并 随 着 类 型 的 变化 而 在 运行 时 
撤销 或 重新 进行 一 些 优化 


第 五 ，Java 语 言 中 对 象 的 内 存 分 配 都 是 堆 上 进行 的 ， 只 有 方法 中 
的 局 部 变量 才能 在 栈 上 分 配器 。 而 C/C++ 的 对 象 则 有 多 种 内 存 分 配方 
式 ， 既 可 能 在 堆 上 分 配 ， 又 可 能 在 栈 上 分 配 ， 如 果 可 以 在 栈 上 分 配 线 
程 私有 的 对 象 ， 将 减轻 内 存 回收 的 压力 。 男 外 ，C/C++ 中 主要 由 用 户 
程序 代码 来 回收 分 配 的 内 存 ， 这 束 不 存在 无 用 对 象 租 选 的 过 程 ， 因 此 
效率 上 〈 仅 指 运行 效率 ， 排 除了 开发 效率 ) 也 比 垃圾 收集 机 制 要 高 。 


上 面 说 了 一 大 堆 Java 语 言 相 对 C/C++ 的 劣势 ， 不 是 说 Java 就 真 的 不 
如 C/C++ 了 ， 相 信 读 者 也 注意 到 了 ，Java 语 言 的 这 些 性 能 上 的 劣势 都 是 
为 了 换取 开发 效率 上 的 优势 而 付出 的 代价 ， 动 态 安全 、 动 态 扩 展 、 垃 
圾 回收 这 些 “ 拖 后 腿 ” 的 特性 都 为 Java 语 言 的 开发 效率 做 出 了 很 大 贡 
献 。 


何况 ， 还 有 许多 优化 是 Java 的 即时 编译 器 能 做 而 C/C++ 的 静态 优化 
编译 器 不 能 做 或 者 不 好 做 的 。 例 如 ， 在 C/C++ 中 ， 别 名 分 析 (Alias 
Analysis) 的 难度 就 要 远 高 于 Java。Java 的 类 型 安全 保证 了 在 类 似 如 下 
代码 中 ， 只 要 ClassA 和 ClassB 没 有 继承 关系 ， 屠 对象 objA 和 objB 束 绝 
不 可 能 是 同一 个 对 象 ， 即 不 会 是 同一 块 内 存 两 个 不 同 别名 。 


void foo (ClassA objA,ClassB objB) { 
objA.x=123; 


objB.y=456; 
// 只 要 objB.y 不 是 0bjA .x 的 别名 ， 下 面 束 可 以 保证 输出 为 123 
print (objA.x) ; 


确定 了 objA 和 objB 并 非 对 方 的 别名 后 ， 许 多 与 数据 依赖 相关 的 优 
化 才 可 以 进行 〈 重 排序 、 变 量 代 换 ) 。 具 体 到 这 个 例子 中 ， 就 是 无 须 
担心 objB.y 其 实 与 objA.x 指 回 同一 块 内 存 ， 这 样 束 可 以 安全 地 确定 打印 
语句 中 的 objA.x 为 123。 


Java 编 译 需 另外 一 个 红利 是 由 它 的 动态 性 所 带 来 的 ， 由 于 C/C++ 编 
译 侣 所 有 优化 都 在 编译 期 完成 ， 以 运行 期 性 能 监控 为 基础 的 优化 措施 
它 都 无 法 进行 ， 如 调用 频率 预测 (Call Frequency Prediction) 、 分 文 频 
率 预 测 (Branch Frequency Prediction) 、 和 裁剪 未 被 选择 的 分 文 
(Untaken Branch Pruning) 等 ， 这 些 都 会 成 为 Java 语 言 独 有 的 性 能 优 
热 。 


[1]C/C++ 与 Java 句 优 驶 和 劣 、 谁 快 谁 慢 这 类 话题 已 经 争论 了 十 几 年 ， 双 
方 的 文 持 者 从 来 都 没有 说 服 过 对 方 ， 有 朋友 好 意 提醒 过 笔者 不 要 跳 入 
这 种 语言 性 能 争论 的 “ 火 坑 ”， 把 这 区 移 除 掉 。 笔 者 在 此 也 特别 说 明 ， 
本 节 的 目的 仅 是 从 编译 和 执行 的 角度 来 探讨 两 者 的 差异 ， 并 不 是 去 评 
判 束 优 妥 盆 。 

[2]Java 中 非 逃 逸 对 象 的 标量 蔡 换 优化 可 以 看 做 是 一 种 高 度 优化 后 的 栈 
F 上 分配， 但 它 相 当 于 把 对 象 拆散 成 局 部 变量 再 进行 的 栈 上 分 配 ， 而 不 


征 C/C++ 那 种 程序 代码 可 控 的 栈 上 分 配方 式 。 


11.5 本章 小 结 


第 10~11 两 章 分 别 介绍 了 Java 程 序 从 源码 编译 成 字 节 码 和 从 字 节 码 
编译 成 本 地 机 器 码 的 过 程 ，Javac 字 节 码 编译 器 与 虚拟 机 内 的 JIT 编 译 
器 的 执行 过 程 合并 起 来 其 实 就 等 同 于 一 个 传统 编译 器 所 执行 的 编译 过 
程 。 


本 章 中 ， 我 们 着 重 了 解 了 虚拟 机 的 热点 探测 方法 、HotSpot 的 即时 
编译 希 、 编 译 触发 条 件 ， 以 及 如 何 从 虚拟 机 外 部 观察 和 分 析 JIT 编 译 的 
数据 和 结 末 ， 还 选择 了 几 种 背 见 的 编译 期 优化 技术 进行 讲解 。 对 Java 
编译 絮 的 深入 了 解 ， 有 助 于 在 工作 中 分 辨 哪些 代码 是 编译 絮 可 以 帮 我 
们 处 理 的 ， 哪 些 代码 需要 目 己 调节 以 便 更 适合 编译 右 的 优化 。 


第 12 章 ”Java 内 存 模型 与 线程 


第 13 章 ”线程 安全 与 锁 优 化 


第 12 革 Java 内 存 模 型 与 线程 


并 发 处 理 的 广泛 应 用 是 使 得 Amdahl 定 律 代替 摩尔 定律 中 成 为 计算 
机 性 能 发 展 源 动力 的 根本 原因 ， 也 是 人 类 “压榨 "计算 机 运算 能 力 的 最 
有 力 武 器 。 


12.1 概述 


多 任务 处 理 在 现代 计算 机 操作 系统 中 几乎 已 是 一 项 必 备 的 功能 
了 。 在 许多 情况 下 ， 让 计算 机 同时 去 做 儿 件 事情 ， 不 仅 是 因为 计算 机 
的 运算 能 力 强 大 了 ， 还 有 一 个 很 重要 的 原因 是 计算 机 的 运算 速度 与 它 
的 存储 和 通信 子 系统 速度 的 产 距 太 大 ， 大 量 的 时 间 都 花费 在 磁盘 MO、 
网 络 通信 或 者 数据 库 访 问 上 。 如果 不 布 望 处 理 占 在 大 部 分 时 间 里 部 处 
等 待 其 他 资源 的 状态 ， 束 必须 使 用 一 些 手段 去 把 处 理 吉 的 运算 能 
力 “ 压 榨 ” 出 来 ， 否 则 束 会 造成 很 大 的 浪费 ， 而 让 计算 机 同时 处 理 几 项 
任务 则 有 是 最 容易 想到 、 也 被 证 明 坪 非常 有 效 的 “压榨 ?手段 。 


除了 充分 利用 计算 机 处 理 融 的 能 力 外 ， 一 个 服务 端 同时 对 多 个 客 
户 端 提 供 服 务 则 是 另 一 个 更 具体 的 并 发 应 用 场景 。 衡 量 一 个 服务 性 能 
的 高 低 好 坏 ， 每 秒 事务 处 理 数 (Transactions Per Second,TPS) 是 最 重 
要 的 指标 之 一 ， 它 代表 着 一 秒 内 服务 端 平均 能 啊 应 的 请 求 总 数 ， 而 
TPS 值 与 程序 的 并 发 能 力 又 有 非常 密切 的 和 关系。 对 于 计算 量 相同 的 任 
务 ， 程 序 线程 并 发 协调 得 越 有 条 不 紊 ， 效 率 目 然 束 会 越 高 ; 反之 ， 线 
程 之 间 频 繁 阻 塞 甚至 死 锁 ， 将 会 大 大 降低 程序 的 并 发 能 


服务 端 是 Java 语 言 最 擅长 的 领域 之 一 ， 这 个 领域 的 应 用 占 了 Java 
应 用 中 最 大 的 一 块 份额 | 时， 不 过 如 何 写 好 并 发 应 用 程序 却 又 是 服务 端 
程序 开发 的 难点 之 一 ， 处 理 好 并 发 方面 的 问题 通常 需 要 更 多 的 编码 经 
验 来 文 持 。 幸 好 Java 语 言 和 虚拟 机 提供 了 许多 工具 ， 把 并 发 编程 的 门 
监 降低 了 不 少 。 并 且 各 种 中 间 件 服务 右 、 各 类 框架 都 努力 地 办 程序 员 
处 理 尽 可 能 多 的 线程 并 发 细 记 ， 使 得 程序 员 在 编码 时 能 更 关注 业务 逻 
辑 ， 而 不 是 花费 大 部 分 时 间 去 关注 此 服务 会 同时 被 多 少 人 调用 、 如 何 
协调 硬件 资源 。 无 论语 言 、 中 间 件 和 框架 如 何 先进 ， 开 发 人 员 都 不 能 
期 望 它们 能 独立 完成 所 有 并 发 处 理 的 事情 ， 了 解 并 发 的 内 幕 也 十 成 为 
一 个 高 级 程序 员 不 可 缺少 的 课程 。 


“高 效 并 发 “是 本 书 讲解 Java 虚 拟 机 的 最 后 一 部 分 ， 将 会 癌 读 者 介 
绍 虚 拟 机 如 何 实现 多 线程 、 多 线程 之 间 由 于 共享 和 竞争 数据 而 导致 的 
一 系列 问题 及 解决 方案 。 


[1]Amdahl 定 律 通过 系统 中 并 行 化 与 串 行 化 的 比重 来 描述 多 处 理 絮 系统 
能 获得 的 运算 加 速 能 力 ， 摩 尔 定律 则 用 于 描述 处 理 器 晶体 管 数量 与 运 

行 效率 之 间 的 发 展 关 系 。 这 两 个 定律 的 更 替代 表 了 近年 来 硬件 发 展 从 
追求 处 理 器 频率 到 奶 求 多 核心 并 行 处 理 的 发 展 过 程 。 

2] 必须 以 代码 的 总 体 规模 来 衡量 ， 服 务 端 应 用 不 能 与 JavaCard、 移 动 

终端 这 些 领域 去 比 绝对 数量 。 


12.2 ”人 硬件 的 效率 与 一 致 性 


在 正式 讲解 Java 虚 拟 机 并 发 相关 的 知识 之 前 ， 我 们 先 花 费 一 点 时 
间 去 了 解 一 下 物理 计算 机 中 的 并 发 问题 ， 物 理 机 中 到 的 并 发 问题 与 虚 
拟 机 中 的 情况 有 不 少 相似 之 处 ， 物 理 机 对 并 发 的 处 理 方案 对 于 虚拟 机 
的 实现 也 有 相当 大 的 参考 意义 。 


“让 计算 机 并 发 执行 若干 个 运算 任务 ” 邱 “ 更 充分 地 利用 计算 机 处 理 
妖 的 效能 ”之 间 的 因 采 关系 ， 看 起 来 顺 理 成 草 ， 实 际 上 它们 之 则 的 关系 
并 没有 想象 中 的 那么 简单 ， 其 中 一 个 重要 的 复杂 性 来 源 是 绝 大 多 数 的 
运算 任务 都 不 可 能 只 靠 处 理 融 “计算 ” 束 能 完成 ， 处 理 嚣 至少 要 与 内 存 
交互 ， 如 读 取 运算 数据 、 存 储 运算 结果 等 ， 这 个 WO 操作 是 很 难 消除 的 
(无 法 仅 靠 寄存 器 来 完成 所 有 运算 任务 ) 。 由 于 计算 机 的 存储 设备 与 
处 理 器 的 运算 速度 有 几 个 数量 级 的 差距 ， 所 以 现代 计算 机 系统 都 不 得 
不 加 入 一 层 读 写 速度 尽 可 能 接近 处 理 器 运算 速度 的 高 速 缓存 (Cache) 
来 作为 内 存 与 处 理事 之 间 的 缓冲 : 将 运算 需要 使 用 到 的 数据 复制 到 组 
存 中 ， 让 运算 能 快速 进行 ， 当 运算 结束 后 再 从 缓存 同步 回 内 存 之 中 ， 
这 样 处 理 右 就 无 须 等 得 缓慢 的 内 存 读 写 了 。 


基于 高 速 缓存 的 存储 交互 很 好 地 解决 了 处 理 句 与 内 存 的 速度 巴 
盾 ， 但 是 也 为 计算 机 系统 市 来 更 高 的 复杂 度 ， 因 为 它 引 入 了 一 个 者 的 


问题 : 缓存 一 致 性 (Cache Coherence) 。 在 多 处 理 器 系统 中 ， 每 个 处 
理 器 都 有 自己 的 高 速 缓存 ， 而 它们 又 共享 同一 主 内 存 (Main 
Memory) ， 如 图 12-1 所 示 。 当 多 个 处 理 妖 的 运算 任务 都 涉及 同一 块 主 
内 存 区 域 时 ， 将 可 能 导致 各 自 的 缓存 数据 不 一 致 ， 如 果真 的 发 生 这 种 
情况 ， 那 同步 回 到 主 内 存 时 以 谁 的 缓存 数据 为 准 呢 ? 为 了 解决 一 致 性 
的 问题 ， 需 要 各 个 处 理 器 访问 缓存 时 都 遵循 一 些 协 议 ， 在 读 写 时 要 根 
据 协 议 来 进行 操作 ， 这 类 协议 有 MSI、MESI (Illinois Protocol) 、 
MOSI、Synapse、Firefly 及 Dragon Protocol 等 。 在 本 章 中 将 会 多 次 提 到 
的 “内 存 模型 ”一 词 ， 可 以 理解 为 在 特定 的 操作 协议 下 ， 对 特定 的 内 存 
或 高 速 缓存 进行 读 写 访问 的 过 程 抽 象 。 不 同 架 构 的 物理 机 器 可 以 拥有 
不 一 样 的 内 存 模型 ， 而 Java 虚 拟 机 也 有 自己 的 内 存 模型 ， 并 且 这 里 介 
绍 的 内 存 访问 操作 与 硬件 的 缓存 访问 操作 具有 很 高 的 可 比 性 。 


除了 增加 高 速 缓存 之 外 ， 为 了 使 得 处 理 囊 内 部 的 运算 单元 能 尽量 
被 充分 利用 ， 处 理 器 可 能 会 对 输入 代码 进行 乱 序 执行 (Out-Of-Order 
Execution) 优化 ， 处 理 器 会 在 计算 之 后 将 乱 序 执 行 的 结果 重组 ， 保 证 
该 结 采 与 顺序 执行 的 结果 是 一 致 的 ， 但 并 不 保证 程序 中 各 个 语句 计算 
的 先后 顺序 与 输入 代码 中 的 顺序 一 致 ， 因 此 ， 如 果 人 存在 一 个 计算 任务 
依赖 男 外 一 个 计算 任务 的 中 间 结 有 果 ， 那 么 其 顺序 性 并 不 能 靠 代 码 的 先 
后 顺序 来 保证 。 与 处 理 絮 的 乱 序 执行 优化 类 似 ，Java 虚 拟 机 的 即时 编 
译 器 中 也 有 类 似 的 指令 重 排 序 (Instruction Reorder) 优化 。 


12.3 Java 内 存 模型 


Java 虚 拟 机 规范 中 试图 定义 一 种 Java 内 存 模型 中 (Java Memory 
Model,JMM) 来 屏蔽 掉 各 种 硬件 和 操作 系统 的 内 存 访问 差异 ， 以 实现 
让 Java 程 序 在 各 种 平台 下 都 能 达到 一 致 的 内 存 访问 效果 。 在 此 之 前 ， 
主流 程序 语言 (如 C/C++ 等 ) 直接 使 用 物理 硬件 和 操作 系统 的 内 存 模 
型 ， 因 此 ， 会 由 于 不 同 乎 台 上 内 存 模型 的 差异 ， 有 可 能 导致 程序 在 一 
套 平台 上 并 发 完全 正常 ， 而 在 男 外 一 套 平 人 台 上 并 发 访问 却 经 常 出 错 ， 
因此 在 某 些 场景 就 必须 针对 不 同 的 平台 来 编写 程序 。 


定义 Java 内 和 存 模型 并 非 一 件 容易 的 事情 ， 这 个 模型 必须 定义 得 足 
够 居间 ， 才 能 让 Java 的 并 发 内 存 访 问 操 作 不 会 产生 上 义 ; 但 是 ， 也 必 
须 定 义 得 足够 宽松 ， 使 得 虚拟 机 的 实现 有 足够 的 目 由 空间 去 利用 硬件 
的 各 种 特性 《寄存器 、 高 速 缓存 和 指令 集中 某 些 特有 的 指令 ) 来 获取 
更 好 的 执行 速度 。 经 过 长 时 间 的 验证 和 修补 ， 在 JDK 1.5 (实现 了 JSR- 
13305) 发 布 后 ，Java 内 存 模型 已 经 成 熟 和 完善 起 来 了 。 


12.3.1 主 内 存 与 工作 内 在 


Java 内 存 模 型 的 主要 目标 是 定义 程序 中 各 个 变量 的 访问 规则 ， 即 
在 虚拟 机 中 将 变量 存储 到 内 存 和 从 内 存 中 取出 变量 这 样 的 的 层 细 记 。 


此 处 的 变量 (Variables) 与 Java 编 程 中 所 说 的 变量 有 所 区 别 ， 它 包括 了 
实例 字段 、 静 仿 字 段 和 构成 数组 对 象 的 元 素 ， 但 不 包括 局 部 变 量 与 方 
法 参数 ， 因 为 后 者 是 线程 私有 的 趾 ， 不 会 被 共享 ， 自 然 就 不 会 存在 竞 
搜 问题 。 为 了 获得 较 好 的 执行 效能 ，Java 内 存 模 型 并 没有 限制 执行 引 
获 使 用 处 理 右 的 特定 寄存 器 或 缓存 来 和 主 内 存 进行 交互 ， 也 没有 限制 
即时 编译 右 进 行 调整 代码 执行 顺序 这 类 优化 措施 。 


Java 内 存 模 型 规定 了 所 有 的 变量 都 存储 在 主 内 存 (Main 
Memory) 中 (此 处 的 主 内 存 与 介绍 物理 硬件 时 的 主 内 存 名 字 一 样 ， 两 
者 也 可 以 互相 类 比 ， 但 此 处 仅 是 虚拟 机 内 存 的 一 部 分 ) 。 每 条 线程 还 
有 自己 的 工作 内 存 (Working Memory， 可 与 前 面 讲 的 处 理 器 高 速 缓存 
类 比 ) ， 线 程 的 工作 内 存 中 保存 了 被 该 线程 使 用 到 的 变量 的 主 内 存 副 
本 拷贝 略 ， 线 程 对 变量 的 所 有 操作 〈 读 取 、 赋 值 等 ) 都 必须 在 工作 内 
存 中 进行 ， 而 不 能 直接 读 写 主 内 存 中 的 变量 路。 不 同 的 线程 之 间 也 无 
法 直接 访问 对 方 工 作 内 存 中 的 变量 ， 线 程 间 变量 值 的 传递 均 需 要 通过 
主 内 存 来 完成 ， 线 程 、 主 内 存 、 工 作 内 存 三 者 的 交互 天 系 如 图 12-2 所 


人 小? 


这 里 所 讲 的 主 内 存 、 工 作 内 存 与 本 书 第 2 章 所 讲 的 Java 内 存 区 域 中 
的 Java 堆 、 栈 、 方 法 区 等 并 不 是 同一 个 层次 的 内 存 划 分 ， 这 两 者 基本 
上 是 没有 关系 的 ， 如 琳 两 者 一 定 要 勉强 对 应 起 来 ， 那 从 变量 、 主 内 
存 、 工 作 内 存 的 定义 来 看 ， 主 内 存 主要 对 应 于 Java 堆 中 的 对 象 实例 数 


据 部 分 5 ， 而 工作 内 存 则 对 应 于 虚拟 机 栈 中 的 部 分 区 域 。 从 更 低层 次 
上 说 ， 主 内 存 束 直接 对 应 于 物理 硬件 的 内 存 ， 而 为 了 获取 更 好 的 运行 
速度 ， 虚 拟 机 (甚至 是 硬件 系统 本 身 的 优化 措施 ) 可 能 会 让 工作 内 存 
优先 存储 于 寄存 化 和 高 速 缓存 中 ， 因 为 程序 运行 时 主要 访问 读 写 的 是 
工作 内 存 。 


12-2 ”线程 、 主 内 存 、 工 作 内 存 三 者 的 交互 关系 (请 与 图 12-1 对 
比 ) 
[1] 本 书 中 的 Java 内 存 模 型 都 特 指 目前 正在 使 用 的 ， 即 在 JDK 1.2 之 后 建 
立 起 来 并 在 JDK 1.5 中 完备 过 的 内 存 模型 。 
[2]JSR-133 : Java Memory Model and Thread Specification Revision 
(Java 内 存 模型 和 线程 规范 修订 ) 。 
[3] 此 处 请 读者 注意 区 分 概念 : 如 果 局 部 变量 是 一 个 reference 类 型 ， 它 
引用 的 对 象 在 Java 堆 中 可 被 各 个 线程 共享 ， 但 是 reference 本 身 在 Java 栈 
的 局 部 变量 表 中 ， 它 是 线程 私有 的 。 


[4] 有 不 少 读者 会 对 这 上段 描述 中 的 “ 抄 贝 副本 ”提出 疑问 ， 如 “假设 线程 中 
访问 一 个 10MB 的 对 象 ， 也 会 把 这 10MB 的 内 存 复 制 一 份 拷贝 出 来 
吗 ? ”， 事 实 上 并 不 会 如 此 ， 这 个 对 象 的 引用 、 对 象 中 某 个 在 线程 访问 
到 的 字段 是 有 可 能 存在 拷贝 的 ， 但 不 会 有 虚拟 机 实现 成 把 整个 对 象 拷 
贝 A 一 次 。 

[5] 根 据 Java 虚 拟 机 规范 的 规定 ，volatile 变 量 依然 有 工作 内 存 的 拷贝 ， 
但 是 由 于 它 特 殊 的 操作 顺序 性 规定 (后 文 会 讲 到 ) ， 所 以 看 起 来 如 同 
直接 在 主 内 存 中 读 写 访问 一 般 ， 因 此 这 里 的 描述 对 于 volatile 也 并 不 存 
在 例外 。 

[6] 除 了 实例 数据 ，Java 堆 还 保存 了 对 象 的 其 他 信息 ， 对 于 HotSpot 虚 拟 
机 来 讲 ， 有 Mark Word (存储 对 象 哈 希 码 、GC 标 志 、GC 年 龄 、 同 步 锁 
等 信息 ) 、Klass Point (指向 存储 类 型 元 数据 的 指针 ) 及 一 些 用 于 字 
节 对 齐 补 白 的 填充 数据 (如 果实 例 数据 刚好 满足 8 字 节 对 齐 的 话 ， 则 可 
以 不 存在 补 白 ) 。 


12.3.2 ”内 存 间 交互 操作 


关于 主 内 存 与 工作 内 存 之 间 具 体 的 交互 协议 ， 即 一 个 变量 如 何 从 
主 内 存 拷贝 到 工作 内 存 、 如 何 从 工作 内 存 同步 回 主 内 存 之 类 的 实现 细 
六 ，Java 内 存 模型 中 定义 了 以 下 8 种 操作 来 完成 ， 虚 拟 机 实现 时 必须 保 
证 下 面 提 及 的 每 一 种 操作 都 是 原子 的 、 不 可 再 分 的 〈 对 于 double 和 1long 
类 型 的 变量 来 说 ，load、store、read 和 write 操作 在 某 些 平台 上 人 允许 有 例 


外 ， 这 个 问题 在 12.3.4 节 再 讲 ) 同 。 


lock (锁定 ) : 作用 于 主 内 存 的 变量 ， 它 把 一 个 变量 标识 为 一 条 
线程 独占 的 状态 。 


unlock (解锁 ) : 作用 于 主 内 存 的 变量 ， 它 把 一 个 处 于 锁定 状态 
的 变量 释放 出 来 ， 释 放 后 的 变量 才 可 以 被 其 他 线程 锁定 。 


read ( 读 取 ) : 作用 于 主 内 存 的 变量 ， 它 把 一 个 变量 的 值 从 主 内 
存 传输 到 线程 的 工作 内 存 中 ， 以 便 随 后 的 load 动 作 使 用 。 


load ( 载 入 ) : 作用 于 工作 内 存 的 变量 ， 它 把 read 操 作 从 主 内 存 中 
得 到 的 变量 值 放 入 工作 内 存 的 变量 副本 中 。 


use (使 用 ) : 作用 于 工作 内 存 的 变量 ， 它 把 工作 内 存 中 一 个 变量 
的 值 传递 给 执行 引擎 ， 每 当 虚 拟 机 中 到 一 个 需要 使 用 到 变量 的 值 的 字 


世 码 指令 时 将 会 执行 这 个 操作 。 


assign 《赋值 ) : 作用 于 工作 内 存 的 变量 ， 它 把 一 个 从 执行 引擎 接 
收 到 的 值 赋 给 工作 内 存 的 变量 ， 每 当 虚 拟 机 遇 到 一 个 给 变量 赋值 的 字 


世 码 指令 时 执行 这 个 操作 。 


store (存储 : 作用 于 工作 内 存 的 变量 ， 它 把 工作 内 存 中 一 个 变 
量 的 值 传送 到 主 内 存 中 ， 以 便 随 后 的 write 操作 使 用 。 


write ( 写 入 ) : 作用 于 主 内 存 的 变量 ， 它 把 store 操 作 从 工作 内 存 
中 得 到 的 变量 的 值 放 入 主 内 存 的 变量 中 。 


如 果 要 把 一 个 变量 从 主 内 存 复制 到 工作 内 存 ， 那 就 要 顺序 地 执行 
read 和 1oad 操 作 ， 如 果 要 把 变量 从 工作 内 存 同步 回 主 内 存 ， 就 要 顺序 地 
执行 store 和 write 操作 。 注 意 ，Java 内 存 模 型 只 要 求 上 述 两 个 操作 必须 
按 顺序 执行 ， 而 没有 保证 是 连续 执行 。 也 就 是 说 ，read 与 load 之 间 、 
store 与 write 之 间 是 可 插入 其 他 指令 的 ， 如 对 主 内 存 中 的 变量 a、b 进 行 
访问 时 ， 一 种 可 能 出 现 顺 序 是 read a、read b、load b、load a。 除 此 之 
外 ，Java 内 存 模型 还 规定 了 在 执行 上 述 8 种 基本 操作 时 必须 满足 如 下 规 
则 : 


不 允许 read 和 ]load、store 和 write 控 作 之 一 单独 出 现 ， 即 不 允许 一 个 
变量 从 主 内 存 读 取 了 但 工作 内 存 不 接受 ， 或 者 从 工作 内 存 发 起 回 写 了 
但 主 内 存 不 接受 的 情况 出 现 。 


不 允许 一 个 线程 丢弃 它 的 最 近 的 assign 操 作 ， 即 变量 在 工作 内 存 中 
改变 了 之 后 必须 把 该 变化 同步 回 主 内 存 。 


不 允许 一 个 线程 无 原因 地 (没有 发 生 过 任何 assign 操 作 ) 把 数据 从 
线程 的 工作 内 存 同步 回 主 内 存 中 。 


一 个 新 的 变量 只 能 在 主 内 存 中 “诞生 ”， 不 允许 在 工作 内 存 中 直接 
使 用 一 个 未 被 初始 化 (load 或 assign) 的 变量 ， 换 句 话 说 ， 就 是 对 一 个 
变量 实施 use、store 操 作 之 前 ， 必 须 先 执行 过 了 assign 和 1load 操 作 。 


一 个 变量 在 同一 个 时 刻 只 允许 一 条 线程 对 其 进行 lock 操 作 ， 但 lock 
操作 可 以 被 同一 条 线程 重复 执行 多 次 ， 多 次 执行 lock 后 ， 只 有 执行 相 
同 次 数 的 unlock 操 作 ， 变 量 才 会 被 解锁 。 


如 果 对 一 个 变量 执行 lock 操 作 ， 那 将 会 清空 工作 内 存 中 此 变量 的 
值 ， 在 执行 引擎 使 用 这 个 变量 前 ， 需 要 重 狐 执行 load 或 assign 操 作 初 始 
化 变量 的 值 。 


如 果 一 个 变量 事先 没有 被 lock 操 作 人 锁定 ， 那 就 不 允许 对 它 执行 
unlock 操 作 ， 也 不 允许 去 unlock 一 个 被 其 他 线程 锁定 住 的 变量 。 


对 一 个 变量 执行 unlock 探 作 之 前 ， 必 须 先 把 此 变量 同步 回 主 内 存 
中 (执行 store、write 操 作 ) 。 


这 8 种 内 存 访问 操作 以 及 上 述 规 则 限定 ， 再 加 上 稍 后 介绍 的 对 
volatile 的 一 些 特殊 规定 ， 束 已 经 完全 确定 了 Java 程 序 中 哪些 内 存 访问 
操作 在 并 发 下 征 安 全 的 。 由 于 这 种 定义 相当 严谨 但 又 十 分 烦 瑛 ， 实 践 
起 来 很 麻烦 ， 所 以 在 12.3.6 帮 中 笔者 将 介绍 这 种 定义 的 一 个 等 效 判断 原 
则 一 一 先行 发 生 原 则 ， 用 来 确定 一 个 访问 在 并 发 环境 下 是 否 安全 。 


[1] 基 于 理解 难度 和 严谨 性 考虑 ， 最 新 的 JSR-133 文 档 中 ， 已 经 放弃 采 
用 这 8 种 操作 去 定义 Java 内 存 模 型 的 访问 协议 了 〈 仅 是 描述 方式 改变 
了 ，Java 内 存 模 型 并 没有 改变 ) 。 


12.3.3 ”对 于 volatile 型 变量 的 特殊 规则 


天 键 字 volatile 可 以 说 是 Java 虚 拟 机 提供 的 最 轻 量 级 的 同步 机 制 ， 
但 是 它 并 不 容易 完全 被 正确 、 完 整地 理解 ， 以 至 于 许多 程序 员 都 习惯 
不 去 使 用 它 ， 遇 到 需要 处 理 多 线程 数据 竞争 问题 的 时 候 一 律 使 用 
synchronized 来 进行 同步 。 了 解 volatile 变 量 的 语义 对 后 面 了 解 多 线程 操 
作 的 其 他 特性 很 有 意义 ， 在 本 节 中 我 们 将 多 论 费 一 些 时 间 去 弄 清 楚 
volatile 的 语义 到 展 是 什么 。 


Java 内 存 模型 对 volatile 专 门 定义 了 一 些 特殊 的 访问 规则 ， 在 介绍 
这 些 比 较 白 口 的 规则 定义 之 前 ， 笔 者 和 完 用 不 那么 正式 但 通俗 易 慌 的 语 
言 来 介绍 一 下 这 个 关键 字 的 作用 。 


当 一 个 变量 定义 为 volatile 之 后 ， 它 将 具备 两 种 特性 ， 第 一 征 保 证 
此 变量 对 所 有 线程 的 可 见 性 ， 这 里 的 “可 见 性 ?是 指 当 一 条 线程 修改 了 
这 个 变量 的 值 ， 新 值 对 于 其 他 线程 来 说 是 可 以 立即 得 知 的 。 而 普通 变 
量 不 能 做 到 这 一 点 ， 普 通 变 量 的 值 在 线程 间 传 递 均 需 要 通过 主 内 存 来 
完成 ， 例 如 ， 线 程 A 修改 一 个 普通 变量 的 值 ， 然 后 向 主 内 存 进行 回 
写 ， 男 外 一 条 线程 B 在 线程 A 回 写 完成 了 之 后 再 从 主 内 存 进行 读 取 操 
作 ， 痢 变量 值 才 会 对 线程 B 可 见 。 


区 


天 于 volatile 变 量 的 可 见 性 ， 经 常会 被 开发 人 员 误 解 ， 认 为 以 下 摘 
述 成 立 : “Volatile 变量 对 所 有 线程 是 立即 可 见 的 ， 对 volatile 变 量 所 有 的 
写 操作 都 能 立刻 反应 到 其 他 线程 之 中 ， 换 句 话说 ，volatile 变 量 在 各 个 
线程 中 是 一 致 的 ， 所 以 基于 volatile 变 量 的 运算 在 并 发 下 是 安全 的 ”。 这 
句 话 的 论据 部 分 并 没有 错 ， 但 是 其 论据 并 不 能 得 出 “基于 volatile 变 量 的 
运算 在 并 发 下 是 安全 的 ”这 个 结论 。volatile 变 量 在 各 个 线程 的 工作 内 存 
中 不 存在 一 致 性 问题 (在 各 个 线程 的 工作 内 存 中 ，volatile 变 量 也 可 以 
存在 不 一 致 的 情况 ， 但 由 于 每 次 使 用 之 前 都 要 移 刷 新 ， 执 行 引 擎 看 不 
到 不 一 致 的 情况 ， 因 此 可 以 认为 不 存在 一 致 性 问题 ) ， 但 是 Java 里 面 
的 运算 并 非 原子 操作 ， 导 致 volatile 变 量 的 运算 在 并 发 下 一 样 是 不 安全 
的 ， 我 们 可 以 通过 一 段 商 单 的 演示 来 说 明 原 因 ， 请 看 代码 清单 12-1 中 
演示 的 例子 。 


代码 清单 12-1 ” volatile 的 运算 


hs 
*Volatile 变 量 自 增 运算 测试 
* 


*@author zzm 

*/ 

public class VolatileTest{ 

public static volatile int race=0; 
public static void increase()t{ 
racett; 


private static final int THREADS COUNT=20; 
public static void main (String[]jargs) { 
Thread[]threads=new Thread[THREADS_COUNT ] ; 
for (int i=0; i<THREADS COUNT; i++) { 
threads[i]=new Thread (new Runnable(){ 
Q@Override 


public void run(){ 
for (int i=0; i<10000; i++) { 
Increase( ) ; 


} 
了 ) ; 
threads[i].start(); 


} 

// 等 待 所 有 累加 线程 都 结束 
while (Thread.activeCount()>1) 
Thread .yield( ); 
System.out.println (race) ; 


} 


这 段 代 码 发 起 了 20 个 线程 ， 每 个 线程 对 race 变 量 进行 10000 次 目 增 
操作 ， 如 采 这 段 代码 能 够 正确 并 发 的 话 ， 最 后 输出 的 结 末 应 该 是 
200000。 读 者 运行 完 这 段 代 码 之 后 ， 并 不 会 获得 期 望 的 结 有 末 ， 而 且 会 
发 现 每 次 运行 程序 ， 输 出 的 结 采 都 不 一 样 ， 都 是 一 个 小 于 200000 的 数 


字 ， 这 是 为 什么 呢 ? 


问题 束 出 现在 目 增 运 算 "race+t+" 之 中 ， 我 们 用 Javap 肥 编译 这 段 代 
码 后 会 得 到 代码 清单 12-2， 发 现 只 有 一 行 代码 的 increase() 方 法 在 Class 
文件 中 是 由 4 条 字 节 码 指令 构成 的 (retum 指 令 不 是 由 race++ 产 生 的 ， 
这 条 指令 可 以 不 计算 ) ， 从 字 市 码 层面 上 很 容易 就 分 析出 并 发 失败 的 
原因 了 : 当 getstatic 指 令 把 race 的 值 取 到 操作 栈 顶 时 ，volatile 天 键 字 保 
证 了 race 的 值 在 此 时 十 正确 的 ， 但 是 在 执行 iconst_1、iadd 这 些 指 令 的 
时 候 ， 其 他 线程 可 能 已 经 把 race 的 值 加 大 了 ， 而 在 操作 栈 顶 的 值 整 变 


成 了 过 期 的 数据 ， 所 以 putstatic 指 令 执行 后 就 可 能 把 较 小 的 race 值 同步 
回 本 内 他 之 时 3 


代码 清单 12-2 ”VolatileTest 的 字 节 人 码 


public static void increase( ); 
Code : 

Stack=2, Locals=0, Args_size=0 
QO:getstatic#13; //Field race:I 
3:iconst_1 

4:iadd 

5:putstatic#13; //Field race:I 
8:return 

LineNumberTable: 

line 14:0 

line 15:8 


客观 地 说 ， 笔 者 在 此 使 用 字 节 码 来 分 析 并 发 问题 ， 仍 然 是 不 严 让 
的 ， 因 为 即使 编译 出 来 只 有 一 条 字 市 码 指令 ， 也 并 不 意味 执行 这 条 指 
令 就 是 一 个 原子 操作 。 一 条 字 节 码 指令 在 解释 执行 时 ， 解 释疑 将 要 运 
行 许多 行 代 码 才能 实现 它 的 语义 ， 如 果 是 编译 执行 ， 一 条 字 世 码 指令 
也 可 能 转化 成 若干 条 本 地 机 器 码 指 令 ， 此 处 使 用 -XX:+PrintAssembly 
参数 输出 反 汇 编 来 分 析 会 更 加 严谨 一 些 ， 但 考虑 到 读者 阅读 的 方便 ， 
并 且 字 市 码 已 经 能 说 明 间 题 ， 所 以 此 处 使 用 字 节 码 来 分 析 。 


由 于 volatile 变 量 只 能 你 证 可 见 性 ， 在 不 符合 以 下 两 条 规则 的 运算 
场景 中 ， 我 们 仍然 要 通过 加 锁 (使 用 synchronized 或 java.util.concurrent 
中 的 原子 类 ) 来 保证 原子 性 。 


运算 结果 并 不 依赖 变量 的 当前 值 ， 或 者 能 够 确保 只 有 单一 的 线程 
变量 的 值 。 


而 在 像 如 下 的 代码 清单 12-3 所 示 的 这 类 场景 束 很 适合 使 用 volatile 
变量 来 控制 并 发 ， 当 shutdown() 方 法 被 调用 时 ， 能 保证 所 有 线程 中 执 
行 的 doWork() 方 法 都 立即 停 下 来 。 


代码 清单 12-3 volatile 的 使 用 场景 


volatile boolean shutdownRequested; 
public void shutdown(){ 
shutdownRequested=true; 

} 

public void dowork( ){ 

while (!shutdownRequested) { 

//do stuff 

} 

} 


使 用 volatile 变 量 的 第 二 个 语义 是 禁止 指令 重 排序 优化 ， 普 通 的 变 
量 仅仅 会 保证 在 该 方法 的 执行 过 程 中 所 有 依赖 赋值 结果 的 地 方 都 能 获 
取 到 正确 的 结 末 ， 而 不 能 保证 变量 赋值 操作 的 顺序 与 程序 代码 中 的 执 
行 顺序 一 致 。 因 为 在 一 个 线程 的 方法 执行 过 程 中 无 法 感知 到 这 点 ， 这 
也 丈 是 Java 内 存 模型 中 描述 的 所 谓 的 “线程 内 表现 为 串 行 的 语 
义 ”(Within-Thread As-If-Serial Semantics) 。 


上 面 的 描述 仍然 不 太 容 易 理 解 ， 我 们 还 征 继续 通过 一 个 例子 来 看 


看 为 何 指令 重 排序 会 干扰 程序 的 并 发 执行 ， 演 示 程 序 如 代码 清单 12-4 
所 示 。 


代码 清单 12-4 ”指令 重 排序 


Map configoptions; 
char[]configText; 

// 此 变量 必须 定义 为 volatile 

volatile boolean initialized=false:; 
// 假 设 以 下 代码 在 线程 A 中 执行 

// 模 拟 读 取 配置 信息 ， 当 读 取 完 成 后 将 initialized 设 置 为 true 以 通知 其 他 线程 配置 


configoptions=new HashMap ( ) ; 
configText=readConfigFile (fileName) ; 
processconfigOptions (configText,configOptions) ; 
initialized=true; 

// 假 设 以 下 代码 在 线程 B 中 执行 

// 等 待 initialized 为 true， 代 表 线 程 A 已 经 把 配置 信息 初始 化 完成 
while (!initialized) { 

Sleep( ); 


} 
// 使 用 线程 A 中 初始 化 好 的 配置 信息 
doSomethingwithConfig(); 


代码 清单 12-4 中 的 程序 是 一 段 伪 代码 ， 其 中 描述 的 场景 十 分 毅 


见 ， 只 是 我 们 在 处 理 配置 文件 时 一 般 不 会 出 现 并 发 而 已 。 如 果 定 义 
initialized 变 量 时 没有 使 用 volatile 修 饰 ， 束 可 能 会 由 于 指令 重 排序 的 优 
化 ， 导 致 位 于 线程 A 中 最 后 一 句 的 代码 "initialized=true" 被 提前 执行 


(这 里 昌 然 使 用 Java 作 为 仿 代 码 ， 但 所 指 的 重 排序 优化 是 机 响 级 的 优 


化 操作 ， 提 前 执行 是 指 这 句 话 对 应 的 汇编 代码 被 提前 执行 ) ， 这 样 在 


线程 B 中 使 用 配置 信息 的 代码 就 可 能 出 现 错 误 ， 而 volatile 关 键 字 则 可 
以 避免 此 类 情况 的 发 生 品 。 


日 令 重 排序 是 并 发 编程 中 最 容易 让 开发 人 员 产 生 疑 惑 的 地 方 ， 除 
了 上 面 伪 代码 的 例子 之 外 ， 笔 者 再 举 一 个 可 以 实际 操作 运行 的 例子 来 
分 析 volatile 关 键 字 是 如 何 禁 止 指令 重 排序 优化 的 。 代 码 清单 12-5 是 一 
段 标准 的 DCL 单 例 代 码 ， 可 以 观察 加 入 volatile 和 未 加 入 volatile 天 键 字 
时 所 生成 汇编 代码 的 差别 (如 何 获得 JIT 的 汇编 代码 ， 请 参考 4.2.7 


节 ) 


代码 清单 12-5 DCL 单 例 模式 


public class Singletont{ 

private volatile static Singleton instance.; 
public static Singleton getInstance()t{ 

if (instance==null) { 

synchronized (Singleton.class) { 

if (instance==null) { 

instance=new Singleton(); 

} 

} 


return Instance; 


public static void main (String[]args) { 
Singleton.getIinstance(); 


编译 后 ， 这 段 代码 对 instance 变 量 赋值 部 分 如 代码 清单 12-6 所 示 。 


代码 清单 12-6 


0x01a3deof :mov$0x3375cdb0， %eSs 工 ...... bebocd75 33 
; {oop ('Singleton') } 


Ox01la3de14:mov%eax, Ox150 (%esi) ; ...... 89865001 0000 
Ox0O1la3dela: shr$0x9, %esi; ...... cliee09 

0xg91a3de1d :movb$ox9，0x1104800 (%esi) ; ..... c6860048 100100 
Ox01la3de24:lock addl$0x0, (%esp) ; .... f0830424 00 


; *putstatic instance 


Singleton:getInstance@24 


通过 对 比 就 会 发 现 ， 关 键 变 化 在 于 有 volatile 修 饰 的 变量 ， 赋 值 后 
(前 面 mov%eax，0x150 (%esi) 这 人 句 便 是 赋值 操作 ) 多 执行 了 一 
个 “lock addl $0x0， (%esp) ”操作 ， 这 个 操作 相当 于 一 个 内 存 屏障 
(Memory Barrier 或 Memory Fence， 指 重 排序 时 不 能 把 后 面 的 指令 重 
排序 到 内 存 屏 障 之 前 的 位 置 ) ， 只 有 一 个 CPU 访问 内 存 时 ， 并 不 需要 
内 存 屏 障 ; 但 如 果 有 两 个 或 更 多 CPU 访问 同一 块 内 存 ， 且 其 中 有 一 个 
在 观测 另 一 个 ， 就 需要 内 存 屏障 来 保证 一 致 性 了 。 这 人 句 指 令 中 的 “addl 
$0x0， (%esp) ”( 把 ESP 寄 存 器 的 值 加 0) 显然 是 一 个 空 操 作 (采用 
这 个 空 操作 而 不 是 空 操 作 指令 nop 是 因为 IJA32 手 册 规定 lock 前 组 不 允许 
配合 nop 指 令 使 用 ) ， 关 键 在 于 lock 前 级 ， 查 询 IA32 手 册 ， 它 的 作用 是 
使 得 本 CPU 的 Cache 写 入 了 内 存 ， 该 写 入 动作 也 会 引起 别 的 CPU 或 者 别 
的 内 核 无 效 化 (Invalidate) 其 Cache， 这 种 操作 相当 于 对 Cache 中 的 变 
量 做 了 一 次 前 面 介 绍 Java 内 存 模式 中 所 说 的 “store 和 write 操作 喇 。 所 
以 通过 这 样 一 个 空 操 作 ， 可 让 前 面 volatile 变 量 的 修改 对 其 他 CPU 立即 

可 见 。 


那 为 何 说 它 禁 止 指令 重 排序 呢 ? 从 硬件 架构 上 讲 ， 指 令 重 排序 是 
指 CPU 采 用 了 人 允许 将 多 条 指令 不 按 程序 规定 的 顺序 分 开发 送 给 各 相应 
电路 单元 处 理 。 但 并 不 是 说 指令 任意 重 排 ，CPU 需 要 能 正确 处 理 指令 
依赖 情况 以 保障 程序 能 得 出 正确 的 执行 结果 。 壁 如 指令 1 把 地 址 A 中 的 
值 加 10， 指 令 2 把 地 址 A 中 的 值 乘 以 2?， 指 令 3 把 地 址 B 中 的 值 减 去 3， 这 
时 指令 1 和 指令 2 是 有 依赖 的 ， 它 们 之 间 的 顺序 不 能 重 排 一 一 (A+10) 
*2 与 A*2+10 显 然 不 相等 ， 但 指令 3 可 以 重 排 到 指令 1、2 之 前 或 者 中 
间 ， 只 要 保证 CPU 执行 后 面 依赖 到 A、B 值 的 操作 时 能 获取 到 正确 的 A 
和 B 值 即 可 。 所 以 在 本 内 CPU 中 ， 重 排序 看 起 来 依然 是 有 序 的 。 
此 ，lock addl$ 0x0， (%esp) 指令 把 修改 同步 到 内 存 时 ， 意 味 着 所 有 
之 前 的 操作 都 已 经 执行 完成 ， 这 样 便 形成 了 “指令 重 排序 无 法 越过 内 存 
屏障 ”的 效 采 。 


解决 了 volatile 的 语义 问题 ， 再 来 看 看 在 众多 保障 并 发 安全 的 工具 
中 选用 volatile 的 意义 一 一 它 能 让 我 们 的 代码 比 使 用 其 他 的 同步 工具 更 
快 吗 ? 在 某 些 情况 下 ，volatile 的 同步 机 制 的 性 能 确实 要 优 于 锁 (使 用 
synchronized 关 键 字 或 java.util.concurrent 包 里 面 的 锁 ) ， 但 是 由 于 虚拟 
机 对 锁 实 行 的 许多 消除 和 优化 ， 使 得 我 们 很 难 量化 地 认为 volatile 束 会 
比 synchronized 快 多 少 。 如 果 让 volatile 自 己 与 自己 比较 ， 那 可 以 确定 一 
个 原则 : volatile 变 量 读 操 作 的 性 能 消耗 与 普通 变量 几乎 没有 什么 差 
别 ， 但 是 写 操作 则 可 能 会 慢 一 些 ， 因 为 它 需 要 在 本 地 代码 中 插入 许多 
内 存 屏 障 指令 来 保证 处 理 器 不 发 生 乱 序 执行 。 不 过 即便 如 此 ， 大 多 数 


场景 下 volatile 的 总 开销 仍然 要 比 锁 低 ， 我 们 在 volatile 与 锁 之 中 选择 的 
唯一 依据 仅仅 是 volatile 的 语义 能 否 满足 使 用 场景 的 需求 。 


在 本 节 的 最 后 ， 我 们 回头 看 一 下 Java 内 存 模 型 中 对 volatile 变 量 定 
义 的 特殊 规则 。 假 定 T 表 示 一 个 线程 ，V 和 W 分 别 表示 两 个 volatile 型 变 
量 ， 那 么 在 进行 read、load、use、assign、store 和 write 操作 时 需要 满足 
如 下 规则 : 


只 有 当 线 程 T 对 变量 V 执 行 的 前 一 个 动作 是 lo0ad 的 时 候 ， 线 程 T 才 
能 对 挛 量 V 执 行 use 动 作 ;， 并且， 只 有 当 线 程 T 对 变量 V 执 行 的 后 一 个 动 
作 是 use 的 时 候 ， 线 程 T 才 能 对 变量 V 执 行 load 动 作 。 线 程 T 对 变量 V 的 
use 动 作 可 以 认为 是 和 线程 T 对 变量 V 的 load、read 动 作 相 关联 ， 必 须 连 
续 一 起 出 现 (这 条 规则 要 求 在 工作 内 存 中 ， 每 次 使 用 V 前 都 必须 先 从 
主 内 存 刷 新 最 新 的 值 ， 用 于 保证 能 看 见 其 他 线程 对 变量 V 所 做 的 修改 
后 的 值 ) 。 


只 有 当 线 程 T 对 变量 V 执 行 的 前 一 个 动作 征 assign 的 时 候 ， 线 程 T 才 
能 对 变量 V 执 行 store 动 作 ; 并 且 ， 只 有 当 线 程 T 对 变量 V 执 行 的 后 一 个 
动作 是 store 的 时 候 ， 线 程 T 才 能 对 变量 V 执 行 assign 动 作 。 线 程 T 对 变量 
V 的 assign 动 作 可 以 认为 是 和 线程 T 对 变量 V 的 store、write 动 作 相 关 
联 ， 必 须 连续 一 起 出 现 (这 条 规则 要 求 在 工作 内 存 中 ， 每 次 修改 V 后 
都 必须 立刻 同步 回 主 内 存 中 ， 用 于 保证 其 他 线程 可 以 看 到 目 己 对 变量 
V 所 做 的 修改 ) 。 


假定 动作 A 是 线程 T 对 变量 V 实 施 的 use 或 assign 动 作 ， 假 定 动作 F 征 
和 动作 A 相关 联 的 load 或 store 动 作 ， 假 定 动 作 P 是 和 动作 F 相 应 的 对 变量 
V 的 read 或 write 动作 ;类 似 的 ， 假 定 动作 B 是 线程 T 对 变量 WwW 实施 的 use 
或 assign 动 作 ， 假 定 动 作 G 十 和 动作 B 相 关联 的 load 或 store 动 作 ， 假 定 
动作 Q 是 和 动作 G 相 应 的 对 变量 WwW 的 read 或 write 动作 。 如 果 A 先 于 B， 
那么 P 先 于 Q (这 条 规则 要 求 volatile 修 饰 的 变量 不 会 被 指令 重 排序 优 
化 ， 保 证 代码 的 执行 顺序 与 程序 的 顺序 相同 ) 。 


[volatile 屏 蔽 指令 重 排序 的 语义 在 JDK 1.5 中 才 被 完全 修复 ， 此 前 的 
JDK 中 即使 将 变量 声明 为 volatile 也 仍然 不 能 完全 避免 重 排序 所 导致 的 
问题 (主要 是 volatile 变 量 前 后 的 代码 仍然 存在 重 排 序 问题 ，， 这 点 也 
是 在 JDK 1.5 之 前 的 Java 中 无 法 安全 地 使 用 DCL ( 双 锁 检测 ) 来 实现 单 
例 模式 的 原因 。 

[2]Doug Lea 列 出 了 各 种 处 理 恬 架构 下 的 内 存 屏 障 指 令 : 
http://g.oswego.edu/d/jmm/cookbook.html ° 


12.3.4 ”对 于 long 和 double 型 变量 的 特殊 规则 


Java 内 存 模 型 要 求 lock、unlock 、read 、load 、assign 、use 、store 、 
write 这 8 个 操作 都 具有 原子 性 ， 但 是 对 于 64 位 的 数据 类 型 (long 和 
double) ， 在 模型 中 特别 定义 了 一 条 相对 宽松 的 规定 : 允许 虚拟 机 将 
没有 被 volatile 修 饰 的 64 位 数据 的 读 写 操作 划分 为 两 次 32 位 的 操作 来 进 
行 ， 即 允许 虚拟 机 实现 选择 可 以 不 保证 64 位 数据 类 型 的 load 、store 、 
read 和 write 这 4 个 操作 的 原子 性 ， 这 点 就 是 所 谓 的 long 和 double 的 非 原 


子 性 协定 (Nonatomic Treatment ofdouble and long Variables) 。 


如 果 有 多 个 线程 共享 一 个 并 未 声明 为 volatile 的 long 或 double 类 型 的 
变量 ， 并 且 同 时 对 它们 进行 读 取 和 修改 操作 ， 那 么 某 些 线程 可 能 会 读 
取 到 一 个 既 非 原 值 ， 也 不 是 其 他 线程 修改 值 的 代表 了 “ 半 个 变量 ”的 数 
值 。 


不 过 这 种 读 取 到 “ 半 个 变量 ”的 情况 非常 罕见 (在 目前 商用 Java 虚 
拟 机 中 不 会 出 现 ) ， 因 为 Java 内 存 模型 虽然 允许 虚拟 机 不 把 long 和 
double 变 量 的 读 写 实现 成 原子 操作 ， 但 允许 虚拟 机 选择 把 这 些 操作 实 
现 为 具有 原子 性 的 操作 ， 而 且 还 “强烈 建议 ”虚拟 机 这 样 实现 。 在 实际 
开发 中 ， 目 前 各 种 平台 下 的 商用 虚拟 机 几乎 都 选择 把 64 位 数据 的 读 写 


操作 作为 原子 操作 来 对 符 ， 因 此 我 们 在 编写 代码 时 一 般 不 需要 把 用 到 
的 long 和 double 变 量 专门 声明 为 volatile 。 


12.3.5 原子 性 、 可 见 性 与 有 序 性 


介绍 完 Java 内 存 模型 的 相关 操作 和 规则 ， 我 们 再 整体 回顾 一 下 这 
个 模型 的 特征 。Java 内 存 模型 是 围绕 着 在 并 发 过 程 中 如 何 处 理 原 子 
性 、 可 见 性 和 有 序 性 这 3 个 特征 来 建立 的 ， 我 们 逐个 来 看 一 下 哪些 操作 

实现 了 这 3 个 特性 。 


原子 性 (Atomicity) : 由 Java 内 存 模型 来 直接 保证 的 原子 性 变量 
操作 包括 read、load、assign、use、store 和 write， 我 们 大 致 可 以 认为 基 
本 数据 类 型 的 访问 读 写 是 具备 原子 性 的 (例外 就 是 long 和 double 的 非 原 
子 性 协定 ， 读 者 只 要 知道 这 件 事情 就 可 以 了 ， 无 须 太 过 在 意 这 些 几 乎 
不 会 发 生 的 例外 情况 ) 。 


如 果 应 用 场景 需要 一 个 更 大 范围 的 原子 性 保证 〈 经 常会 遇 到 ) ， 
Java 内 存 模型 还 提供 了 lock 和 unlock 操 作 来 满足 这 种 需求 ， 尽 管 虚 拟 机 
未 把 lock 和 unlock 操 作 直 接 开 放 给 用 户 使 用 ， 但 是 却 提供 了 更 高 层次 的 
字 节 人 码 指令 monitorenter 和 monitorexit 来 隐 式 地 使 用 这 两 个 操作 ， 这 两 
个 字 节 码 指 令 反 映 到 Java 代 码 中 就 是 同步 块 
因此 在 synchronized 块 之 间 的 操作 也 具备 原子 性 。 


synchronized 关 键 字 ， 


可 见 性 (Visibility) : 可 见 性 是 指 当 一 个 线程 修改 了 共享 变量 的 
值 ， 其 他 线程 能 够 立即 得 知 这 个 修改 。 上 文 在 讲解 volatile 变 量 的 时 候 


我 们 已 详细 讨论 过 这 一 点 。Java 内 存 模型 是 通过 在 变量 修改 后 将 新 值 
同步 回 主 内 存 ， 在 变量 读 取 前 从 主 内 存 刷新 变量 值 这 种 依赖 主 内 存 作 
为 传递 媒介 的 方式 来 实现 可 见 性 的 ， 无 论 是 普通 变量 还 是 volatile 变 量 
都 是 如 此 ， 普 通 变量 与 volatile 变 量 的 区 别 是 ，volatile 的 特殊 规则 保证 
了 新 值 能 立即 同步 到 主 内 存 ， 以 及 每 次 使 用 前 立即 从 主 内 存 刷新 。 因 
此 ， 可 以 说 volatile 保 证 了 多 线程 操作 时 变量 的 可 见 性 ， 而 普通 变量 则 
不 能 保证 这 一 点 。 


除了 volatile 之 外 ，Java 还 有 两 个 关键 字 能 实现 可 见 性 ， 即 
synchronized 和 final。 同 步 块 的 可 见 性 是 由 “对 一 个 变量 执行 unlock 操 作 
之 前 ， 必 须 先 把 此 变量 同步 回 主 内 存 中 (执行 store、write 操 作 ) ”这 条 
规则 获得 的 ， 而 final 关 键 字 的 可 见 性 是 指 : 被 final 修 饰 的 字段 在 构造 
器 中 一 旦 初始 化 完成 ， 并 且 构 造 器 没有 把 "this" 的 引用 传递 出 去 (this 
引用 逃逸 是 一 件 很 危险 的 事情 ， 其 他 线程 有 可 能 通过 这 个 引用 访问 
到 “初始 化 了 一 半 ” 的 对 象 ) ， 那 在 其 他 线程 中 就 能 看 见 final 字 段 的 
值 。 如 代码 清单 12-7 所 示 ， 变 量 i 与 j 都 具备 可 见 性 ， 它 们 无 须 同步 就 能 
被 其 他 线程 正确 访问 。 


代码 清单 12-7 final 与 可 见 性 


public static final int i; 
public final int j:; 
statict{ 

i=0; 

//do something 

} 


{ 

// 也 可 以 选择 在 构造 画 数 中 初始 化 
j=0; 

//do something 


有 序 性 (Ordering) : Java 内 存 模 型 的 有 序 性 在 前 面 讲解 volatile 时 
也 详细 地 讨论 过 了 ，Java 程 序 中 天 然 的 有 序 性 可 以 总 结 为 一 句 话 : 如 
果 在 本 线程 内 观察 ， 所 有 的 操作 都 是 有 序 的 ; 如果 在 一 个 线程 中 观察 
另 一 个 线程 ， 所 有 的 操作 都 是 无 序 的 。 前 半 句 是 指 “线程 内 表现 为 串 行 
的 语义 ”(Within-Thread As-If-Serial Semantics) ， 后 半 句 是 指 “指令 重 
排序 现象 和 “工作 内 存 与 主 内 存 同 步 延 迟 ”现象 。 


Java 语 言 提供 了 volatile 和 synchronized 两 个 关键 字 来 保证 线程 之 间 
操作 的 有 序 性 ，volatile 天 键 子 本 身 束 包 含 了 禁止 指令 重 排序 的 语义 ， 
而 synchronized 则 是 由 “一 个 变量 在 同一 个 时 刻 只 允许 一 条 线程 对 其 进 
行 lock 操 作 ” 这 条 规则 获得 的 ， 这 条 规则 决定 了 持 有 同一 个 锁 的 两 个 同 
步 块 只 能 第 行 地 进入 。 


介绍 完 并 发 中 3 种 重要 的 特性 后 ， 读 者 有 没有 发 现 synchronized 关 
键 字 在 需要 这 3 种 特性 的 时 候 都 可 以 作为 其 中 一 种 的 解决 方案 ”看 起 来 
很 < 万 能 ? 吧 。 的 确 ， 大 部 分 的 并 发 控制 操作 都 能 使 用 synchronized 来 完 
成 。synchronized 的 “万 能 ”也 间接 造 束 了 它 被 程序 员 滥 用 的 局 面 ， 
越 “万 能 ”的 并 发 控制 ， 通 常会 伴随 着 越 大 的 性 能 影响 ， 这 点 我 们 将 在 
第 13 章 讲解 虚拟 机 锁 优 化 时 再 介绍 。 


12.3.6 ”移行 发 生 原 则 


如 果 Java 内 存 模型 中 所 有 的 有 序 性 都 仅仅 靠 volatile 和 synchronized 
来 完成 ， 那 么 有 一 些 操作 将 会 变 得 很 烦琐 ， 但 是 我 们 在 编写 Java 并 发 
代码 的 时 候 并 没有 感觉 到 这 一 点 ， 这 是 因为 Java 语 言 中 有 一 个 “先行 发 
生 ” (happens-before) 的 原则 。 这 个 原则 非常 重要 ， 它 是 判断 数据 是 
否 存在 竞争 、 线 程 是 否 安全 的 主要 依据 ， 依 靠 这 个 原则 ， 我 们 可 以 通 
过 几 条 规则 一 拔 子 地 解决 并 发 环境 下 两 个 操作 之 间 是 否 可 能 存在 神 突 
的 所 有 问题 。 


现在 融 来 看 看 “先行 发 生 ” 原 则 指 的 是 什么 。 人 移行 发 生 是 Java 内 存 
模型 中 定义 的 两 项 操作 之 间 的 侦 序 关系 ， 如 果 说 操作 A 移 行 发 生 于 操 
作 B， 其 实 束 是 说 在 发 生 操 作 B 之 前 ， 操 作 A 产生 的 影响 能 被 操作 B 观 
察 到 , “影响 "包括 修改 了 内 存 中 共享 变量 的 值 、 发 送 了 消 轧 、 调 用 了 
方法 等 。 这 人 句 话 不 难 理解 ， 但 它 意 味 着 什么 呢 ? 我 们 可 以 举 个 例子 来 
说 明 一 下 ， 如 代码 清单 12-8 中 所 示 的 这 3 句 伪 代码 。 


代码 请 单 12-8 ”先行 发 生 原则 示例 1 


// 以 下 操作 在 线程 A 中 执行 
i=1; 
// 以 下 操作 在 线程 8 中 执行 
j=i; 
// 以 下 操作 在 线程 C 中 执行 


i=2; 


假设 线程 A 中 的 操作 "i=1" 先 行 发 生 于 线程 B 的 操作 "j=i"， 那 么 可 以 
确定 在 线程 B 的 操作 执行 后 ， 变 量 j 的 值 一 定 等 于 1， 得 出 这 个 结论 的 依 
据 有 两 个 :一 是 根据 先行 发 生 原则 ，"i=1" 的 结果 可 以 被 观察 到 ;二 是 
线程 C 还 没 “ 登 场 ”， 线 程 A 操 作 结 束 之 后 没有 其 他 线程 会 修改 变量 i 的 
值 。 现 在 再 来 考虑 线程 C， 我 们 依然 保持 线程 A 和 线程 B 之 间 的 先行 发 
生 关 系 ， 而 线程 C 出 现在 线程 A 和 线程 B 的 操作 之 间 ， 但 是 线程 C 与 线 
程 B 没 有 移行 发 生 关 系 ， 那 j 的 值 会 征 多 少 呢 ? 答案 是 不 确定 ! 1 和 2 都 
有 可 能 ， 因 为 线程 C 对 变量 i 的 影响 可 能 会 被 线程 B 观 察 到 ， 也 可 能 不 
会 ， 这 时 候 线程 B 束 存在 读 取 到 过 期 数据 的 风险 ,不 具备 多 线程 安全 
光 


下 面 是 Java 内 存 模型 下 一 些 “ 天 然 的 ”先行 发 生 关 系 ， 这 些 先 行 发 
生 关 系 无 须 任何 同步 絮 协 助 束 已 经 存在 ， 可 以 在 编码 中 直接 使 用 。 如 
果 两 个 操作 之 间 的 关系 不 在 此 列 ， 并 且 无 法 从 下 列 规则 推导 出 来 的 
话 ， 它 们 就 没有 顺序 性 保障 ， 虚 拟 机 可 以 对 它们 随意 地 进行 重 排序 。 


程序 次 序 规则 (Program Order Rule) : 在 一 个 线程 内 ， 按 照 程序 
代码 顺序 ， 书 写 在 前 面 的 操作 移行 发 生 于 书写 在 后 面 的 操作 。 准确 地 
说 ， 应 该 是 控制 流 顺 序 而 不 是 程序 代码 顺序 ， 因 为 要 考虑 分 文 、 循 环 


等 结构 。 


管 程 锁定 规则 (Monitor Lock Rule) : 一 个 unlock 操 作 先 行 发 生 于 
后 面 对 同 一 个 锁 的 lock 探 作 。 这 里 必须 强调 的 是 同一 个 锁 ， 而 “后 


面 ?是 指 时 间 上 的 先后 顺序 。 


volatile 变 量规 则 (Volatile Variable Rule) : 对 一 个 volatile 变 量 的 
写 操 作 先 行 发 生 于 后 面 对 这 个 变量 的 读 操 作 ， 这 里 的 “后 面 * 同 样 是 指 
时 间 上 的 先后 顺序 。 


线程 启动 规则 (Thread Start Rule) : Thread 对 象 的 start0 方 法 先行 
发 生 于 此 线程 的 每 一 个 动作 。 


线程 终止 规则 (Thread Termination Rule) : 线程 中 的 所 有 操作 都 
先行 发 生 于 对 此 线程 的 终止 检测 ， 我 们 可 以 通过 Thread.join0 方 法 结 
束 、Thread.isAlive0 的 返回 值 等 手段 检测 到 线程 已 经 终止 执行 。 


线程 中 断 规则 (Thread Interruption Rule) : 对 线程 interrupt(O) 方 法 
的 调用 先行 发 生 于 被 中 断 线 程 的 代码 检测 到 中 断 事件 的 发 生 ， 可 以 通 
过 Thread.interrupted() 方 法 检测 到 是 否 有 中 上 断 发 生 。 

对 象 终结 规则 (Finalizer Rule) : 一 个 对 象 的 初始 化 完成 (构造 
函数 执行 结束 ) 先行 发 生 于 它 的 finalize0 方 法 的 开始 。 

传递 性 (Transitivity) : 如 果 操 作 A 先 行 发 生 于 操作 B， 操 作 B 先 
行 发 生 于 操作 C， 那 束 可 以 得 出 操作 A 先行 发 生 于 操作 C 的 结论 。 


Java 语 言 无 须 任何 同步 手段 保障 束 能 成 立 的 先行 发 生 规则 整 只 
上 面 这 些 了 ， 笔 着 演示 一 下 如 何 使 用 这 些 规 则 去 判定 操作 间 是 否 具备 


顺序 性 ， 对 于 读 写 共 至 变量 的 操作 来 说 ， 就 是 线程 是 否 安全 ， 读 者 还 
可 以 从 下 面 这 个 例子 中 感受 一 下 “时 间 上 的 先后 顺序 ”与 “先行 发 生 ” 之 
间 有 什么 不 同 。 演 示例 子 如 代码 清单 12-9 所 示 。 


代码 清单 12-9 ”先行 发 生 原则 示例 2 


private int Value=0; 
pubilc void setValue (int value) { 
this .value=value:; 


} 
public int getValue(){ 
return Value; 


} 


代码 清单 12-9 中 显示 的 古 一 组 再 普通 不 过 的 getter/setter 方 法 ， 假 
设 存在 线程 A 和 B， 线 程 A 先 (时间 上 的 先后 ) 调用 了 "setValue 
(1) "， 然 后 线程 B 调 用 了 同一 个 对 象 的 "getValue0"， 那 么 线程 B 收 到 
的 返回 值 是 什么 ? 


我 们 依次 分 析 一 下 先行 发 生 原则 中 的 各 项 规则 ， 由 于 两 个 方法 分 
别 由 线程 A 和 线程 B 调 用 ， 不 在 一 个 线程 中 ， 所 以 程序 次 序 规则 在 这 里 
不 适用 ; 由 于 没有 同步 块 ， 目 然 束 不 会 发 生 lock 和 unlock 操 作 ， 所 以 管 
程 锁定 规则 不 适用 ;由 于 value 变 量 没有 被 volatile 关 键 字 修 烦 ， 所 以 
volatile 变 量规 则 不 适用 ; 后面 的 线程 启动、 终止 、 中 断 规则 和 对 象 终 
结 规则 也 和 这 里 完全 没有 关系 。 因 为 没有 一 个 适用 的 先行 发 生 规则 ， 
所 以 最 后 一 条 传递 性 也 无 从 谈 起 ， 因 此 我 们 可 以 判定 尽管 线程 A 在 操 


作 时 间 上 先 于 线程 B， 但 是 无 法 确定 线程 B 中 "getValue()" 方 法 的 返回 结 
果 ， 换 句 话说， 这 里 面 的 操作 不 是 线程 安全 的 。 


那 怎么 修复 这 个 问题 呢 ? 我 们 至 少 有 两 种 比较 人 简单 的 方案 可 以 碗 
择 : 要 么 把 gettersetter 方 法 都 定义 为 Synchronized 方 法 ， 这 样 就 可 以 套 
用 管 程 锁定 规则 ; 了 要么 把 value 定 义 为 volatile 变 量 ， 由 于 setter 方 法 对 
value 的 修改 不 依赖 value 的 原 值 ， 满 足 volatile 关 键 字 使 用 场景 ， 这 样 丈 
可 以 套用 volatile 变 量规 则 来 实现 先行 发 生 关 系 。 


通过 上 面 的 例子 ， 我 们 可 以 得 出 结论 : 一 个 操作 “时 间 上 的 先 发 
生 ” 不 代表 这 个 操作 会 是 “先行 发 生 ， 那 如 果 一 个 操作 “先行 发 生 ”* 是 否 
忠 能 推导 出 这 个 操作 必定 是 “时 间 上 的 先 发 生 * 呢 ?很 遗憾 ， 这 个 推论 
也 是 不 成 立 的 ， 一 个 典型 的 例子 束 是 多 次 提 到 的 “指令 重 排序 ”， 洲 示 
例子 如 代码 清单 12-10 所 示 。 


代码 清单 12-10 ”先行 发 生 原则 示例 3 


// 以 下 操作 在 同一 个 线程 中 执行 
int i=1:; 
int J=2; 


代码 清单 12-10 的 两 条 赋值 语句 在 同一 个 线程 之 中 ， 根 据 程序 次 序 
规则 ，"int i=1" 的 操作 先行 发 生 于 "int j=2"， 但 是 "int j=2" 的 代码 完全 可 
能 移 被 处 理 器 执行 ， 这 并 不 影响 先行 发 生 原则 的 正确 性 ， 因 为 我 们 在 
这 条 线程 之 中 没有 办 法 感知 到 这 点 。 


上 面 两 个 例子 综合 起 来 证 明了 一 个 结论 ， 时 间 先 后 顺序 与 先行 发 
生 原则 之 间 基 本 没有 太 大 的 关系 ， 所 以 我 们 衡量 并 发 安全 问题 的 时 候 
不 要 受到 时 间 顺 序 的 干扰 ， 一 切 必 须 以 先行 发 生 原 则 为 准 。 


12.4 Java 与 线程 


并 发 不 一 定 要 依赖 多 线程 (如 PHP 中 很 常见 的 多 进程 并 发 ) ， 但 
征 在 Java 里 面谈 论 并 发 ， 大 多 数 都 与 线程 脱 不 开关 系 。 既 然 我 们 这 本 
书 探讨 的 话题 是 Java 虚 拟 机 的 特性 ， 那 讲 到 Java 线 程 ， 我 们 就 从 Java 线 
程 在 虚拟 机 中 的 实现 开始 讲 起 。 


12.4.1 ”线程 的 实现 


我 们 知道 ， 线 程 是 比 进程 更 轻 量 级 的 调度 执行 单位 ， 线 程 的 引 
入 ， 可 以 把 一 个 进程 的 资源 分 配 和 执行 调度 分 开 ， 各 个 线程 既 可 以 共 
享 进程 资源 〈 内 存 地 址 、 文 件 IO 等 ) ， 又 可 以 独立 调度 (线程 是 CPU 
调度 的 基本 单位 ) 。 


主流 的 操作 系统 都 提供 了 线程 实现 ，Java 语 言 则 提供 了 在 不 同 硬 
件 和 操作 系统 平台 下 对 线程 操作 的 统一 处 理 ， 每 个 已 经 执行 start0 且 还 
未 结束 的 java.lang.Thread 类 的 实例 束 代 表 了 一 个 线程 。 我 们 注意 到 
Thread 类 与 大 部 分 的 Java API 有 显 闭 的 差别 ， 它 的 所 有 关键 方法 都 是 声 
明 为 Native 的 。 在 Java API 中 ， 一 个 Native 方 法 往往 意味 着 这 个 方法 没 
有 使 用 或 无 法 使 用 平台 无 关 的 手段 来 实现 (当然 也 可 能 是 为 了 执行 效 
率 而 使 用 Native 方 法 ， 不 过 ， 通 党 最 高 效率 的 手段 也 吏 是 平台 相关 的 


手段 ) 。 正 因为 如 此 ， 作 者 把 本 节 的 标题 定 为 “线程 的 实现 ”而 不 
是 “Java 线 程 的 实现 ”。 


实现 线程 主要 有 3 种 方式 : 使 用 内 核 线程 实现 、 使 用 用 户 线程 实现 
和 使 用 用 户 线 程 加 轻 量 级 进程 混合 实现 。 


1. 使 用 内 核 线程 实现 


内 核 线程 (Kernel-Level Thread,KLT) 就 是 直接 由 操作 系统 内 核 
(Kernel， 下 称 内 核 ) 支持 的 线程 ， 这 种 线程 由 内 核 来 完成 线程 切 
换 ， 内 核 通 过 操纵 调度 器 (Scheduler) 对 线程 进行 调度 ， 并 负责 将 线 
程 的 任务 映射 到 各 个 处 理 器 上 。 每 个 内 核 线程 可 以 视 为 内 核 的 一 个 分 
身 ， 这 样 操 作 系 统 就 有 能 力 同时 人 处理 多 件 事情 ， 支 持 多 线程 的 内 核 就 
叫做 多 线程 内 核 (Multi-Threads Kernel) 。 


程序 一 般 不 会 直接 去 使 用 内 核 线程 ， 而 是 去 使 用 内 核 线程 的 一 种 
高 级 接口 一 一 轻 量 级 进程 (Light Weight Process,LWP) ， 轻 量 级 进程 
就 是 我 们 通常 意义 上 所 讲 的 线程 ， 由 于 每 个 轻 量 级 进程 都 由 一 个 内 核 
线程 文 持 ， 因 此 只 有 先 文 持 内 核 线程 ， 才 能 有 轻 量 级 进程 。 这 种 轻 量 
级 进程 与 内 核 线程 之 间 1:1 的 关系 称 为 一 对 一 的 线程 模型 ， 如 图 12-3 所 
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12-3” 轻 量 级 进程 与 内 核 线 程 之 则 1:1 的 关系 


由 于 内 核 线程 的 支持 ， 每 个 轻 量 级 进程 都 成 为 一 个 独立 的 调度 单 
元 ， 即 使 有 一 个 轻 量 级 进程 在 系统 调用 中 阻塞 了 ， 也 不 会 影响 整个 进 
程 继续 工作 ， 但 是 轻 量 级 进程 具有 它 的 局 限 性 : 首先 ， 由 于 是 基于 内 
核 线程 实现 的 ， 所 以 各 种 线程 操作 ， 如 创建 、 析 构 及 同步 ， 都 需要 进 
行 系统 调用 。 而 系统 调用 的 代价 相对 较 高 ， 需 要 在 用 户 态 (User 
Mode) 和 内 核 态 (Kernel Mode) 中 来 回 切换 。 其 次 ， 每 个 轻 量 级 进 
程 都 需要 有 一 个 内 核 线程 的 支持 ， 因 此 轻 量 级 进程 要 消耗 一 定 的 内 核 
资源 (如 内 核 线程 的 栈 空间 ) ， 因 此 一 个 系统 支持 轻 量 级 进程 的 数量 
是 有 限 的 。 


2. 使 用 用 户 线程 实现 


从 广义 上 来 讲 ， 一 个 线程 只 要 不 是 内 核 线程 ， 束 可 以 认为 是 用 户 
线程 (User Thread,UT) ， 因 此 ， 从 这 个 定义 上 来 讲 ， 轻 量 级 进程 也 
属于 用 户 线程 ， 但 轻 量 级 进程 的 实现 始终 是 建立 在 内 核 之 上 的 ， 许 多 
操作 都 要 进行 系统 调用 ， 效 率 会 受到 限制 。 


而 狭义 上 的 用 户 线程 指 的 是 完全 建立 在 用 户 空间 的 线程 库 上 ， 系 
统 内 核 不 能 感知 线程 存在 的 实现 。 用 户 线程 的 建立 、 同 步 、 销 毁 和 调 
度 完全 在 用 户 态 中 完成 ， 不 需要 内 核 的 帮助 。 如 采 程 序 实现 得 当 ， 这 
种 线程 不 需要 切换 到 内 核 态 ， 因 此 操作 可 以 是 非常 快速 且 低 消耗 的 ， 
也 可 以 支持 规模 更 大 的 线程 数量 ， 部 分 高 性 能 数据 库 中 的 多 线程 就 是 
由 用 户 线程 实现 的 。 这 种 进程 与 用 户 线程 之 间 1:N 的 关系 称 为 一 对 多 的 
线程 模型 ， 如 图 12-4 所 示 。 


12-4 进程 与 用 户 线程 之 间 1:N 的 关系 


使 用 用 户 线程 的 优势 在 于 不 需要 系统 内 核 文 援 ， 和 劣势 也 在 于 没有 
系统 内 核 的 文 援 ， 所 有 的 线程 操作 都 需要 用 户 程序 目 己 处 理 。 线 程 的 
创建 、 切 换 和 调度 都 是 需要 考虑 的 问题 ， 而 且 由 于 操作 系统 只 把 处 理 
绒 资 源 分 配 到 进程 ， 那 诸如 “阻塞 如 何 处 理 ”`“ 多 处 理 万 系统 中 如 何 将 
线程 映射 到 其 他 人 处理 絮 上 ”这 类 问题 解决 起 来 将 会 异 第 困难， 甚至 不 可 
能 完成 。 因 而 使 用 用 户 线程 实现 的 程序 一 般 都 比较 复杂 小 ， 除 了 以 前 
在 不 支持 多 线程 的 操作 系统 中 (如 DOS) 的 多 线程 程序 与 少数 有 特殊 
需求 的 程序 外 ， 现 在 使 用 用 户 线程 的 程序 越 来 越 少 了 ，Java、Ruby 等 
语言 都 曾经 使 用 过 用 户 线程 ， 最 终 又 都 放弃 使 用 它 。 


3. 使 用 用 户 线程 加 轻 量 级 进程 宴 合 实现 


线程 除了 依赖 内 核 线程 实现 和 完全 由 用 户 程序 目 己 实现 之 外 ， 还 
有 一 种 将 内 核 线 程 与 用 户 线程 一 起 使 用 的 实现 方式 。 在 这 种 混合 实现 
下 ， 既 存在 用 户 线程 ， 也 存在 轻 量 级 进程 。 用 户 线程 还 是 完全 建立 在 
用 户 鹤 间 中 ， 因 此 用 户 线程 的 创建 、 切 换 、 析 构 等 操作 依然 廉价 ， 并 
且 可 以 文 持 大 规模 的 用 户 线程 并 发 。 而 操作 系统 提供 文 持 的 轻 量 级 进 
程 则 作为 用 户 线程 和 内 核 线程 之 间 的 桥架 ， 这 样 可 以 使 用 内 核 提 供 的 
线程 调度 功能 及 处 理 亏 映 射 ， 并 且 用 户 线 程 的 系统 调用 要 通过 轻 量 级 
线程 来 完成 ， 大 大 降低 了 整个 进程 被 完全 阻塞 的 风险 。 在 这 种 混合 模 


式 中 ， 用 户 线程 与 轻 量 级 进程 的 数量 比 是 不 定 的 ， 即 为 N:M 的 关系 ， 
如 图 12-5 所 示 ， 这 种 就 是 多 对 多 的 线程 模型 。 


许多 UNIX 系 列 的 操作 系统 ， 如 Solaris、HP-UX 等 都 提供 了 N:M 的 
线程 模型 实现 。 


图 12-5 用 户 线程 与 轻 量 级 进程 之 间 N:M 的 关系 


4.Java 线 程 的 实现 


Java 线 程 在 JDK 1.2 之 前 ， 是 基于 称 为 “绿色 线程 ”\Green 
Threads) 的 用 户 线程 实现 的 ， 而 在 JDK 1.2 中 ， 线 程 模型 替换 为 基于 
操作 系统 原生 线程 模型 来 实现 。 因 此 ， 在 目前 的 JDK 版 本 中 ， 操 作 系 
统 文 持 怎样 的 线程 模型 ， 在 很 大 程度 上 决定 了 Java 虚 拟 机 的 线程 是 怎 


样 映 射 的， 这 点 在 不 同 的 平台 上 没有 办 法 达成 一 致 ， 虚 拟 机 规范 中 也 
并 未 限定 Java 线 程 需要 使 用 哪 种 线程 模型 来 实现 。 线 程 模 型 只 对 线程 
的 并 发 规模 和 操作 成 本 产生 影响 ， 对 Java 程 序 的 编码 和 运行 过 程 来 
说 ， 这 些 兰 异 都 是 透明 的 。 


对 于 Sun JDK 来 说 ， 它 的 Windows 版 与 Linux 版 都 是 使 用 一 对 一 的 
线程 模型 实现 的 ， 一 条 Java 线 程 就 映射 到 一 条 轻 量 级 进程 之 中 ， 因 为 
Windows 和 Linux 系 统 提供 的 线程 模型 就 是 一 对 一 的 [2] 。 


而 在 Solaris 平 台中 ， 由 于 操作 系统 的 线程 特性 可 以 同时 支持 一 对 
一 (通过 Bound Threads 或 Alternate Libthread 实 现 ) 及 多 对 多 (通过 
LWP/Thread Based Synchronization 实 现 ) 的 线程 模型 ， 因 此 在 Solaris 版 
的 JDK 中 也 对 应 提供 了 两 个 平台 专 有 的 虚拟 机 参数 : - 
XX:+UseLWPSynchronization (默认 值 ) 和 -XX:+UseBoundThreads 来 明 
确 指定 虚拟 机 使 用 哪 种 线程 模型 。 


[1 此 处 所 讲 的 “复杂 ”与 “程序 目 己 完成 线程 操作 ”， 并 不 限制 程序 中 必 
须 编 写 了 复杂 的 实现 用 户 线 程 的 代码 ， 使 用 用 户 线程 的 程序 ， 很 多 都 
依赖 特定 的 线程 库 来 完成 基本 的 线程 操作 ， 这 些 复杂 性 都 封装 在 线程 
牵 之 Hs 

[2]Windows 下 有 纤 程 包 (Fiber Package) ，Linux 下 也 有 NGPT (在 2.4 
内 核 的 年 代 ) 来 实现 N:M 模 型 ， 但 是 它们 都 没有 成 为 主流 。 


12.4.2 Java 线程 调度 


线程 调度 是 指 系 统 为 线程 分 配 处 理 器 使 用 权 的 过 程 ， 主 要 调度 方 
式 有 两 种 ， 分 别 是 协同 式 线程 调度 (Cooperative Threads-Scheduling) 
和 抢占 式 线程 调度 (Preemptive Threads-Scheduling) 。 


如 采 使 用 协同 式 调度 的 多 线程 系统 ， 线 程 的 执行 时 间 由 线程 本 身 
来 控制 ， 线 程 把 目 己 的 工作 执行 完了 之 后 ， 要 主动 通知 系统 切换 到 田 
外 一 个 线程 上 。 协 同 式 多 线程 的 最 大 好 处 古 实 现价 单 ， 而 且 由 于 线程 
要 把 目 己 的 事情 干 完 后 才 会 进行 线程 切换 ， 切 换 操 作对 线程 目 己 是 可 
知 的 ， 所 以 没有 什么 线程 同步 的 问题 。Lua 语 言 中 的 “协同 例 程 ”就 古 这 
类 实现 。 它 的 坏处 也 很 明显 : 线程 执行 时 间 不 可 控制 ， 甚 至 如 果 一 个 
线程 编写 有 问题 ， 一 直 不 告知 系统 进行 线程 切换 ， 那 么 程序 就 会 一 直 
阻塞 在 那里 。 很 久 以 前 的 Windows 3.x 系 统 就 是 使 用 协同 式 来 实现 多 进 
程 多 任务 的 ， 相 当 不 稳定 ， 一 个 进程 坚持 不 让 出 CPU 执 行 时 间 就 可 能 


会 导致 整个 系统 毅 算 。 


如 采 使 用 抢占 式 调度 的 多 线程 系统 ， 那 么 每 个 线程 将 由 系统 来 分 
配 执行 时 间 ， 线 程 的 切换 不 由 线程 本 号 来 决定 (在 Java 中 ， 
Thread.yield() 可 以 让 出 执行 时 间 ， 但 是 要 获取 执行 时 间 的 话 ， 线 程 本 身 
是 没有 什么 办 法 的 ) 。 在 这 种 实现 线程 调度 的 方式 下 ， 线 程 的 执行 时 
间 是 系统 可 探 的 ， 也 不 会 有 一 个 线程 导致 整个 进程 阻塞 的 问题 ，Java 使 


用 的 线程 调度 方式 就 是 抢占 式 调度 。 与 前 面 所 说 的 Windows 3.x 的 例 
子 相 对 ， 在 Windows 9x/NT 内 核 中 就 古 使 用 抢占 式 来 实现 多 进程 的 ， 当 
一 个 进程 出 了 问题 ， 我 们 还 可 以 使 用 任务 管理 右 把 这 个 进程 “ 杀 挥 ”， 

而 不 至 于 导致 系统 月 汝 。 


虽然 Java 线 程 调度 是 系统 自动 完成 的 ， 但 是 我 们 还 是 可 以 “建议 ” 系 
统 给 某 些 线程 多 分 配 一 点 执行 时 间 ， 另 外 的 一 些 线程 则 可 以 少 分 配 一 
点 一 一 这 项 操作 可 以 通过 设置 线程 优先 级 来 完成 。Java 语 言 一共 设 置 了 
10 个 级 别 的 线程 优先 级 〈Thread.MIN_PRIORITY 至 
Thread.MAX_PRIORITY) ， 在 两 个 线程 同时 处 于 Ready 状 态 时 ， 优 先 
级 越 高 的 线程 越 容 易 被 系统 选择 执行 。 


不 过 ， 线 程 优先 级 并 不 是 太 靠 谱 ， 原 因 是 Java 的 线程 是 通过 映射 到 
系统 的 原生 线程 上 来 实现 的 ， 所 以 线程 调度 最 终 还 是 取决 于 操作 系 
统 ， 虽 然 现 在 很 多 操作 系统 都 提供 线程 优先 级 的 概念 ， 但 是 并 不 见得 
能 与 Java 线 程 的 优先 级 一 一 对 应 ， 如 Solaris 中 有 2147483648 (23) 种 优 
先 级 ， 但 Windows 中 就 只 有 7 种 ， 比 Java 线 程 优 先 级 多 的 系统 还 好 说 ， 
中 间 留 下 一 点 空位 就 可 以 了 ， 但 比 Java 线 程 优先 级 少 的 系统 ， 就 不 得 不 
出 现 几 个 优先 级 相同 的 情况 了 ， 表 12-1 显 示 了 Java 线 程 优 先 级 与 
Windows 线 程 优先 级 之 间 的 对 应 关系 ，Windows 平 台 的 JDK 中 使 用 了 除 
THREAD _PRIORITY _IDLE 之 外 的 其 余 6 种 线程 优先 级 。 


表 12-1 Java 线程 优先 级 与 Windows 线程 优先 级 之 间 的 对 应 关系 


Java 线程 优先 级 Windows 线程 优先 级 
1 (Thread.MIN_PRIORITY ) THREAD PRIORITY LOWEST 
2 THREAD PRIORITY LOWEST 
3 THREAD_ PRIORITY _ BELOW_NORMAL 
4 THREAD PRIORITY BELOW NORMAL 
5 (Thread.NORM PRIORITY) THREAD PRIORITY NORMAL 
6 THREAD PRIORITY ABOVE NORMAL 
7 THREAD PRIORITY ABOVE NORMAL 
8 THREAD PRIORITY HIGHEST 
9 THREAD PRIORITY HIGHEST 
10 (Thread.MAX PRIORITY) THREAD PRIORITY CRITICAL 


上 文 说 到 “线程 优先 级 并 不 是 太 靠 谱 ”， 不 仅仅 是 说 在 一 些 平 台 上 
不 同 的 优先 级 实际 会 变 得 相同 这 一 点 ， 还 有 其 他 情况 让 我 们 不 能 太 依 
赖 优先 级 ， 优 先 级 可 能 会 被 系统 目 行 改变 。 例 如 ， 在 Windows 系 统 中 存 
在 一 个 称 为 “优先 级 推进 器 ”(Priority Boosting， 当 然 它 可 以 被 关闭 掉 ) 
的 功能 ， 它 的 大 致 作用 就 是 当 系 统 发 现 一 个 线程 执行 得 特别 “勤奋 努 
力 ” 的 话 ， 可 能 会 越过 线程 优 移 级 去 为 它 分 配 执行 时 间 。 因 此 ， 我 们 不 
能 在 程序 中 通过 优先 级 来 完全 准确 地 判断 一 组 状态 都 为 Ready 的 线程 将 
会 先 执行 哪 一 个 。 


[1] 在 JDK 后 续 版 本 中 有 可 能 会 提供 协 程 (Coroutines) 方式 来 进行 多 任 
务 处 理 ， 相 天 资 料 可 参 见 


http://wikis.sun.com/display/mlvm/Coroutines ° 


A 


12.4.3 ”状态 转换 


Java 语 言 定义 了 5 种 线程 状态 ， 在 任意 一 个 时 间 点 ， 一 个 线程 只 能 
有 且 只 有 其 中 的 一 种 状态 ， 这 5 种 状态 分 别 如 下 。 


新 建 (New) : 创建 后 尚未 启动 的 线程 处 于 这 种 状态 。 


运行 (Runable) : Runable 包 括 了 操作 系统 线程 状态 中 的 Running 
和 Ready， 也 就 是 处 于 此 状态 的 线程 有 可 能 正在 执行 ， 也 有 可 能 正在 
等 待 着 CPU 为 它 分 配 执 行 时 间 。 


无 限期 等 待 (Waiting) : 处 于 这 种 状态 的 线程 不 会 被 分 配 CPU 执 
行 时 间 ， 它 们 要 等 待 被 其 他 线程 显 式 地 唤醒 。 以 下 方法 会 让 线程 陷入 
无 限期 的 等 待 状态 : 


e 没 有 设置 Timeout 参 数 的 Object.wait(0) 方 法 。 
e 没 有 设置 Timeout 参 数 的 Thread.join0 方 法 。 
eLockSupport.park() 方 法 。 


限期 等 待 Timed Waiting) : 处 于 这 种 状态 的 线程 也 不 会 被 分 配 
CPU 执行 时 间 ， 不 过 无 须 等 竺 被 其 他 线程 显 式 地 唤醒 ， 在 一 定时 间 之 
后 它们 会 由 系统 目 动 唤醒 。 以 下 方法 会 让 线程 进入 限期 等 待 状态 : 


eThread.sleep0 方 法 。 

e 设 置 了 Timeout 参 数 的 Object.wait() 方 法 。 
e 设 置 了 Timeout 参 数 的 Thread.join(0 方 法 。 
eLockSupport.parkNanos() 方 法 。 
eLockSupport.parkUntil0 方 法 。 


阻塞 Blocked) : 线程 被 阻塞 了 , “阻塞 状态 ?与 “等 待 状态 ”的 区 
别 是 : “阻塞 状态 ?在 等 待 着 获 取 到 一 个 排他 锁 ， 这 个 事件 将 在 另外 一 
个 线程 放弃 这 个 锁 的 时 候 发 生 ;， 而 “等 待 状态 ?" 则 是 在 等 竺 一 段 时 间 ， 
或 者 唤醒 动作 的 发 生 。 在 程序 等 待 进入 同步 区 域 的 时 候 ， 线 程 将 进入 


这 种 状态 。 


结束 (Terminated) : 已 终止 线程 的 线程 状态 ， 线 程 已 经 结束 执 


上 述 5 种 状态 在 遇 到 特定 事件 发 生 的 时 候 将 会 互相 转换 ， 它 们 的 转 
换 关系 如 图 12-6 所 示 。 


Blocked 


synchronized 


imed Waiting 


图 12-6 线程 状态 转换 关系 


sleep() 


run() 结 束 


notify()/notifyAll() 


wait() 


12.5 “本章 小 结 


本 革 中 ， 我 们 首先 了 解 了 虚拟 机 Java 内 存 模型 的 结构 及 操作 ， 然 
后 讲解 了 原子 性 、 可 见 性 、 有 序 性 在 Java 内 存 模 型 中 的 体现 ， 最 后 介 
绍 了 移行 发 生 原 则 的 规则 及 使 用 。 另 外 ， 我 们 还 了 解 了 线程 在 Java 语 
言 之 中 是 如 何 实现 的 。 


关于 “ 融 效 并 发 ”这 个 话题 ， 在 本 章 中 主要 介绍 了 虚拟 机 如 何 实 
现 “ 并 发 ”， 在 第 13 章 中 ， 我 们 的 主要 关注 点 将 是 虚 拟 机 如 何 实现 “高 
效 ”， 以 及 虚拟 机 对 我 们 编写 的 并 发 代码 提供 了 什么 样 的 优化 手段 。 


第 13 草 ”线程 安全 与 锁 优 化 


并 发 处 理 的 广泛 应 用 是 使 得 Amdahl 定 律 代 蔡 摩尔 定律 成 为 计算 机 
性 能 发 展 源 动力 的 根本 原因 ， 也 是 人 类 “压榨 ?计算 机 运算 能 力 的 最 有 
力 武器 。 


13.1 概述 


在 软件 业 发 展 的 初期 ， 程 序 编写 都 是 以 算法 为 核心 鸣 ， 程 序 员 会 
把 数据 和 过 程 分 别 作 为 独立 的 部 分 来 考虑 ， 数 据 代 表 问 题 空间 中 的 客 
体 ， 程 序 代码 则 用 于 处 理 这 些 数据 ， 这 种 思维 方式 直接 站 在 计算 机 的 
角度 去 抽象 问题 和 解决 问题 ， 称 为 面向 过 程 的 编程 思想 。 与 此 相对 的 
是， 面 问 对 象 的 编程 思想 是 站 在 现实 世界 的 角度 去 抽象 和 解决 问题 ， 
它 把 数据 和 行为 部 看 做 古 对 象 的 一 部 分 ， 这 样 可 以 让 程序 员 能 以 符合 
现实 世界 的 思维 方式 来 编写 和 组 织 程 序 。 


面向 过 程 的 编程 思想 极 大 地 提升 了 现代 软件 开发 的 生产 效率 和 软 
件 可 以 达到 的 规模 ， 但 是 现实 世界 与 计算 机 世界 之 间 不 可 避免 地 存在 
一 些 差 异 。 例 如 ， 和 人 们 很 难 想象 现实 中 的 对 象 在 一 项 工作 进行 期 间 ， 
会 被 不 停 地 中 断 和 切换 ， 对 象 的 属性 (数据 ) 可 能 会 在 中 断 期 间 被 修 
改 和 变 “ 脏 ”， 而 这 些 事件 在 计算 机 世界 中 则 是 很 正常 的 事情 。 有 时 


候 ， 民 好 的 设计 原则 不 得 不 同 现实 做 出 一 些 让 步 ， 我 们 必须 让 程序 在 
计算 机 中 正确 无 误 地 运行 ， 然 后 再 考虑 如 何 将 代码 组 织 得 更 好 ， 让 程 
序 运 行 得 更 快 。 对 于 这 部 分 的 主题 “高效 并 发 来 讲 ， 首 允 需 要 保证 并 
发 的 正确 性 ， 然 后 在 此 基础 上 实现 高 效 。 本 章 先 从 如 何 保 证 并 发 的 正 
确 性 和 如 何 实现 线程 安全 讲 起 。 


13.2 线程 安全 


“线程 安全 ”这 个 名 称 ， 相 信 稍 有 经 验 的 程序 员 都 会 听 说 过 ， 甚 至 
在 代码 编写 和 走 查 的 时 候 可 能 还 会 经 党 挂 在 嘴 边 ， 但 是 如 何 找到 一 个 
不 太 指 口 的 概念 来 定义 线程 安全 却 不 是 一 件 容易 的 事情 ， 笔 者 尝试 在 
Google 中 搜索 它 的 概念 ， 找 到 的 古 类 似 于 “如 果 一 个 对 象 可 以 安全 地 被 
多 个 线程 同时 使 用 ， 那 它 就 是 线程 安全 的 ”这 样 的 定义 一 一 并 不 能 说 它 
不 正确 ， 但 是 人 们 无 法 从 中 获取 到 任何 有 用 的 信息 。 


笔者 认为 《Java Concurrency In Practice》 的 作者 Brian Goetz 对 “ 线 
程 安全 ”有 一 个 比较 恰当 的 定义 :“ 当 多 个 线程 访问 一 个 对 象 时 ， 如 果 
不 用 考虑 这 些 线程 在 运行 时 环境 下 的 调度 和 交替 执行 ， 也 不 需要 进行 
额外 的 同步 ， 或 者 在 调用 方 进行 任何 其 他 的 协调 操作 ， 调 用 这 个 对 象 
的 行为 都 可 以 获得 正确 的 结果 ， 那 这 个 对 象 是 线程 安全 的 ”。 


这 个 定义 比较 严谨 ， 它 要 求 线程 安全 的 代码 都 必须 具备 一 个 特 
征 : 代码 本 身 封 逆 了 所 有 必要 的 正确 性 保障 手段 (如 互 不 同步 等 ) ， 
令 调 用 者 无 须 关 心 多 线程 的 问题 ， 更 无 须 目 己 采 取 任 何 措施 来 保证 多 
线程 的 正确 调用 。 这 点 听 起 来 简单 ， 但 其 实 并 不 容易 做 到 ， 在 大 多 数 
场景 中 ， 我 们 都 会 将 这 个 定义 弱化 一 些 ， 如 果 把 “调用 这 个 对 象 的 行 
为 ”限定 为 “ 单 次 调用 ”， 这 个 定义 的 其 他 描述 也 能 够 成 立 的话 ， 我 们 束 


可 以 称 它 是 线程 安全 了 ， 为 什么 要 弱化 这 个 定义 ， 现 在 暂且 放下 ， 稍 
后 再 详细 探讨 。 


13.2.1 ” Java 语言 中 的 线程 安全 


我 们 已 经 有 了 线程 安全 的 一 个 抽象 定义 ， 那 接 下 来 殉 讨 论 一 下 在 
Java 语 言 中 ， 线 程 安 全 具体 是 如 何 体现 的 ? 有 哪些 操作 十 线程 安全 
的 ? 我 们 这 里 讨论 的 线程 安全 ， 束 限定 于 多 个 线程 之 间 存 在 共 至 数据 
访问 这 个 前 提 ， 因 为 如 果 一 段 代码 根本 不 会 与 其 他 线程 共 译 数据 ， 那 
么 从 线程 安全 的 角度 来 看 ， 程 序 是 串 行 执行 还 是 多 线程 执行 对 它 来 说 


征 完 全 没有 区 别 的 。 


为 了 更 加 深入 地 理解 线程 安全 ， 在 这 里 我 们 可 以 不 把 线程 安全 当 
做 一 个 非 真 即 假 的 二 元 排他 选项 来 看 待 ， 按 照 线 程 安全 的 “安全 程 
度 ” 由 强 至 弱 来 排序 ， 我 们 岂可 以 将 Java 语 言 中 各 种 操作 共享 的 数据 分 
为 以 下 5 类 : 不 可 变 、 绝 对 线程 安全 、 相 对 线程 安全 、 线 程 兼容 和 线程 
对 立 。 


1. 不 可 变 


在 Java 语 言 中 〈 特 指 JDK 1.5 以 后 ， 即 Java 内 存 模 型 被 修正 之 后 的 
Java 语 言 ) ， 不 可 变 (Immutable) 的 对 象 一 定 是 线程 安全 的 ， 无 论 是 
对 象 的 方法 实现 还 是 方法 的 调用 者 ， 都 不 需要 再 采取 任何 的 线程 安全 


保障 措施 ， 在 第 12 章 我 们 谈 到 final 关 键 字 带 来 的 可 见 性 时 曾经 提 到 过 
这 一 点 ， 只 要 一 个 不 可 变 的 对 象 被 正确 地 构建 出 来 (没有 发 生 this 引 用 
逃逸 的 情况 ) ， 那 其 外 部 的 可 见 状态 永远 也 不 会 改变 ， 永 远 也 不 会 看 
到 它 在 多 个 线程 之 中 处 于 不 一 致 的 状态 。“ 不 可 变 ” 市 来 的 安全 性 是 最 
简单 和 最 纯粹 的 。 


Java 语 言 中 ， 如 果 共 享 数据 是 一 个 基本 数据 类 型 ， 那 么 只 要 在 定 
义 时 使 用 final 关 键 字 修饰 它 就 可 以 保证 它 是 不 可 变 的。 如 果 共 享 数 据 
是 一 个 对 象 ， 那 就 需要 保证 对 象 的 行为 不 会 对 其 状态 产生 任何 影响 才 
行 ， 如 果 读 者 还 没 想 明白 这 句 话 ， 不 妨 想 一 想 java.lang.String 类 的 对 
象 ， 它 是 一 个 典型 的 不 可 变 对 象 ， 我 们 调用 它 的 substring()、replace() 
和 concat(0) 这 些 方法 都 不 会 影响 它 原来 的 值 ， 只 会 返回 一 个 新 构造 的 字 
符 串 对 象 。 


保证 对 象 行为 不 影响 目 己 状态 的 途径 有 很 多 种 ， 其 中 最 簿 单 的 束 
征 把 对 象 中 市 有 状态 的 变量 都 声明 为 fnal， 这 样 在 构造 函数 结束 之 
后 ， 它 殉 是 不 可 变 的 ， 例 如 代码 清单 13-1 中 java.lang.Integer 构 造 画 数 


所 示 的 ， 它 通过 将 内 部 状态 变量 value 定 义 为 final 来 保障 状态 不 变 。 


代码 清单 13-1 JDK 中 Integer 类 的 构造 函数 


hs 

*The value of the<code>Integer</code>. 
*@serial 

* 


private final int Value; 


全 

*Constructs a newly allocated<code>Integer</code>object that 
*represents the specified<code>int</code>value. 

* 


*Q@param value the value to be represented by the 
*<code>Integer</code>object. 
*/ 

public Integer (int value) { 
this .value=value:; 


在 Java API 中 符合 不 可 变 要 求 的 类 型 ， 除 了 上 面 提 到 的 String 之 
外 ， 常 用 的 还 有 枚 举 类 型 ， 以 及 java.lang.Number 的 部 分 子 类 ， 如 Long 
和 Double 等 数值 包装 类 型 ，BigInteger 和 BigDecimal 等 大 数据 类 型 ， 但 
同 为 Number 的 子 类 型 的 原子 类 AtomicInteger 和 AtomicLong 则 并 非 不 可 
变 的 ， 读 者 不 妨 看 看 这 两 个 原子 类 的 源码 ， 想 一 想 为 什么 。 


2. 绝 对 线程 安全 


绝对 的 线程 安全 完全 满足 Brian Goetz 给 出 的 线程 安全 的 定义 ， 这 
个 定义 其 实 征 很 严格 的 ， 一 个 类 要 达到 “不 管 运行 时 环境 如 何 ， 调 用 者 
都 不 需要 任何 额外 的 同步 措施 "通常 需要 付出 很 大 的 ， 甚 至 有 时 候 坪 不 
切实 际 的 代价 。 在 Java API 中 标注 目 己 是 线程 安全 的 类 ， 大 多 数 都 不 
是 绝对 的 线程 安全 。 我 们 可 以 通过 Java API 中 一 个 不 是 “绝对 线程 安 
全 ”的 线程 安全 类 来 看 看 这 里 的 “绝对 ”是 什么 意思 。 


如 果 说 java.util.Vector 是 一 个 线程 安全 的 容器 ， 相 信 所 有 的 Java 程 
序 员 对 此 都 不 会 有 异议 ， 因 为 它 的 add0、get0 和 size(O 这 类 方法 都 是 被 


synchronized 修 饰 的 ， 尽 管 这 样 效率 很 低 ， 但 确实 是 安全 的 。 但 是 ， 即 
使 它 所 有 的 方法 都 被 修饰 成 同步 ， 也 不 意味 着 调用 它 的 时 候 永 远 都 不 
再 需要 同步 手段 了 ， 请 看 一 下 代码 清单 13-2 中 的 测试 代码 。 


代码 清单 13-2 ”对 Vector 线程 安全 的 测试 


private static Vector<Integer >vector=new Vector<Integer> ():; 
public static void main (String[]args) { 

while (true) { 

for (int i=0; i<10; i++) { 

vector.add (i) ; 


Thread removeThread=new Thread (new Runnable( ){ 
Q@Override 

public void run()t{ 

for (int i=0; i<vector.size(); i++) { 
vector.remove (i), 

} 

} 

}) ; 

Thread printThread=new Thread (new Runnable( ){ 
Q@Override 

public void run(){ 

for (int i=0; i<vector,size(); i++) { 
System,out .println ( (vector.get (i) ) ) ; 

} 


} 

}) ; 

removeThread. start( ); 

printThread. start(); 

// 不 要 同时 产生 过 多 的 线程 ， 否 则 会 导致 操作 系统 假死 
while (Thread.activeCount()>20) ; 

} 

} 


运行 结 来 如 下 : 


Exception in thread"Thread- 
132"java.lang.ArrayIndexOutOofBoundsException: 


Array index out of range:17 

at java.util.Vector .remove (Vector.java:777) 

at org.fenixsoft.mulithread.VectorTest$1.run 
(VectorTest. java:21) 

at java.lang.Thread.run (Thread.java:662) 


很 明显 ， 尽 管 这 里 使 用 到 的 Vector 的 get()、remove() 和 size() 方 法 都 
是 同步 的 ， 但 是 在 多 线程 的 环境 中 ， 如 果 不 在 方法 调用 端 做 额外 的 同 
步 措施 的 话 ， 使 用 这 段 代 码 仍然 是 不 安全 的 ， 因 为 如 果 另 一 个 线程 恰 
好 在 错误 的 时 间 里 删除 了 一 个 元 素 ， 导 致 序号 已 经 不 再 可 用 的 话 ， 再 
用 i 访问 数组 就 会 抛 出 一 个 ArrayIndexOutOfBoundsException。 如 果 要 
保证 这 段 代 码 能 正确 执行 下 去 ， 我 们 不 得 不 把 removeThread 和 
printThread 的 定义 改 成 如 代码 清单 13-3 所 示 的 样子 。 


代码 清单 13-3 ”必须 加 入 同步 以 保证 Vector 访问 的 线程 安全 性 


Thread removeThread=new Thread (new Runnable(){ 
Qoverride 

public void run(){ 

synchronized (vector) { 

for (int i=0; i<vector.size(); i++) { 
vector.remove (i) ; 


} 


}) : 

Thread printThread=new Thread (new Runnable( ){ 
Q@Override 

public void run()t{ 

synchronized (vector) { 

for (int i=0; i<vector.size(); i++) { 
System.out.println ( (vector.get (i) ) ) ; 


} 
} 
}) : 


3. 相 对 线程 安全 


相对 的 线程 安全 融 是 我 们 通 芝 意义 上 所 讲 的 线程 安全 ， 它 需要 保 
证 对 这 个 对 象 单独 的 操作 十 线程 安全 的 ， 我 们 在 调用 的 时 候 不 需要 做 
额外 的 保障 措施 ， 但 是 对 于 一 些 特定 顺序 的 连续 调用 ， 束 可 能 需要 在 
调用 端 使 用 额外 的 同步 手段 来 保证 调用 的 正确 性 。 上 面 代码 清单 13-2 
和 代码 清单 13-3 束 是 相对 线程 安全 的 明显 的 案例 。 


在 Java 语 言 中 ， 大 部 分 的 线程 安全 类 都 属于 这 种 类 型 ， 例 如 
Vector、HashTable、Collections 的 SynchronizedCollection0) 方 法 包装 的 


集合 等 。 
4. 线 程 兼 容 


线程 兼容 是 指 对 象 本 号 并 不 是 线程 安全 的 ， 但 是 可 以 通过 在 调用 
端正 确 地 使 用 同步 手段 来 保证 对 象 在 并 发 环境 中 可 以 安全 地 使 用 ， 我 
们 平常 说 一 个 类 不 是 线程 安全 的 ， 绝 大 多 数 时 候 指 的 是 这 一 种 情况 。 
Java API 中 大 部 分 的 类 都 是 属于 线程 兼容 的 ， 如 与 前 面 的 Vector 和 
HashTable 相 对 应 的 集合 类 ArrayList 和 HashMap 等 。 


5. 线 程 对 芯 


线程 对 立 征 指 无 论调 用 端 是 否 采取 了 同步 措施 ， 都 无 法 在 多 线程 
环境 中 并 发 使 用 的 代码 。 由 于 Java 语 言 天 生 就 具备 多 线程 特性 ， 线 程 


对 立 这 种 排 不 多 线程 的 代码 是 很 少 出 现 的 ， 而 且 通 常 都 古 有 害 的 ， 应 
当 尽量 避免 。 


一 个 线程 对 立 的 例子 是 Thread 类 的 suspend0 和 resume() 方 法 ， 如 果 
有 两 个 线程 同时 持 有 一 个 线程 对 象 ， 一 个 党 试 去 中 断 线程 ， 另 一 个 党 
试 去 恢复 线程 ， 如 果 并 发 进行 的 话 ， 无 论调 用 时 是 否 进 行 了 同步 ， 目 
标 线程 都 是 存在 死 锁 风 险 的 ， 如 果 suspend0 中 断 的 线程 就 是 即将 要 执 
行 resume0) 的 那个 线程 ， 那 就 肯定 要 产生 死 锁 了 “。 也 正 是 由 于 这 个 原 
因 ，suspend() 和 resume() 方 法 已 经 被 JDK 声 明 废 弃 〈@Deprecated ) 

了 。 常 见 的 线程 对 立 的 操作 还 有 System.setIn()、Sytem.setOut() 和 


System.runFinalizersOnExit() 等 。 


[1] 这 种 划分 方法 也 是 Brian Goetz 在 IBM developWorkers 上 发 表 的 一 篇 
论文 中 提出 的 ， 这 里 写 “ 我 们 ”纯粹 是 笔者 下 笔 行文 中 的 语言 用 法 。 


1322 线程 安全 的 实现 方 潜 


了 解 了 什么 是 线程 安全 之 后 ， 紧 接着 的 一 个 问题 束 是 我 们 应 该 如 
何 实现 线程 安全 ， 这 听 起 来 似乎 是 一 件 由 代码 如 何 编 写 来 决定 的 事 
情 ， 确 实 ， 如 何 实 现 线程 安全 与 代码 编写 有 很 大 的 关系， 但 虚拟 机 提 
供 的 同步 和 锁 机 制 也 起 到 了 非常 重要 的 作用 。 本 市 中 ， 代 码 编写 如 何 
实现 线程 安全 和 虚拟 机 如 何 实现 同步 与 锁 这 两 者 都 会 有 所 涉及 ， 相 对 
而 言 更 偏重 后 者 一 些 ， 只 要 读者 了 解 了 虚拟 机 线程 安全 手段 的 运作 过 
程 ， 目 己 去 思考 代码 如 何 编写 并 不 是 一 件 困 难 的 事情 。 


1. 互 斥 同 步 


互 斥 同步 〈Mutual Exclusion&Synchronization) 是 常见 的 一 种 并 
发 正确 性 保障 手段 。 同 步 是 指 在 多 个 线程 并 发 访问 共享 数据 时 ， 保 证 
共享 数据 在 同一 个 时 刻 只 被 一 个 (或 者 是 一 些 ， 使 用 信号 量 的 时 候 ) 
线程 使 用 。 而 互 斥 是 实现 同步 的 一 种 手段 ， 临 界 区 (Critical 
Section) 、 互 不 量 (Mutex) 和 信号 量 (Semaphore) 都 是 主要 的 互 不 
实现 方式 。 因 此 ， 在 这 4 个 字 里 面 ， 互 斥 是 因 ， 同 步 是 果 ; 互 斥 是 方 
法 ， 同 步 是 目的 。 


在 Java 中 ， 最 基本 的 互 不 同步 手段 束 是 synchronized 关 键 字 ， 
synchronized 天 键 字 经 过 编译 之 后 ， 会 在 同步 块 的 前 后 分 别 形成 


monitorenter 和 monitorexit 这 两 个 字 市 码 指令 ， 这 两 个 字 节 码 都 需要 一 
个 reference 类 型 的 参数 来 指明 要 锁定 和 解锁 的 对 象 。 如果 Java 程 序 中 的 
synchronized 明 确 指 定 了 对 象 参数 ， 那 束 是 这 个 对 象 的 reference; 如 果 
没有 明确 指定 ， 那 就 根据 synchronized 修 饰 的 是 实例 方法 还 是 类 方法 ， 
去 取 对 应 的 对 象 实例 或 Class 对 象 来 作为 锁 对 象 。 


根据 虚拟 机 规范 的 要 求 ， 在 执行 monitorenter 指 令 时 ， 首 先 要 壬 试 
获取 对 象 的 锁 。 如 果 这 个 对 象 没 被 锁定 ， 或 者 当前 线程 已 经 拥有 了 那 
个 对 象 的 山 ， 把 锁 的 计数 天 加 1， 相 应 的 ， 在 执行 monitorexit 指 令 时 会 
将 锁 计 数 万 减 1， 当 计数 釉 为 0 时 ， 锁 惑 被 释放 。 如 果 获 取 对 象 锁 失 
败 ， 那 当前 线程 殉 要 阻塞 等 待 ， 直 到 对 象 锁 被 另外 一 个 线程 释放 为 
并 


在 虚拟 机 规范 对 monitorenter 和 monitorexit 的 行为 描述 中 ， 有 两 点 
是 需要 特别 注意 的 。 首 先 ，synchronized 同 步 块 对 同一 条 线程 来 说 是 可 
重 入 的 ， 不 会 出 现 自己 把 自己 锁 死 的 问题 。 其 次 ， 同 步 块 在 已 进入 的 
线程 执行 完 之 前 ， 会 阻塞 后 面 其 他 线程 的 进入 。 第 12 章 讲 过 ，Java 的 
线程 是 映射 到 操作 系统 的 原生 线程 之 上 的 ， 如 果 要 阻塞 或 唤醒 一 个 线 
程 ， 都 需要 操作 系统 来 帮忙 完成 ， 这 就 需要 从 用 户 态 转换 到 核心 态 
中 ， 因 此 状态 转换 需要 耗费 很 多 的 处 理 器 时 间 。 对 于 代码 简单 的 同步 
块 《如 被 synchronized 修 饰 的 getter0 或 setter() 方 法 ) ， 状 态 转换 消耗 的 
时 间 有 可 能 比 用 户 代码 执行 的 时 间 还 要 长 。 所 以 synchronized 是 Java 语 


言 中 一 个 重量 级 (Heavyweight) 的 操作 ， 有 经 验 的 程序 员 都 会 在 确实 
必要 的 情况 下 才 使 用 这 种 操作 。 而 虚拟 机 本 喘 也 会 进行 一 些 优化 ， 璧 
如 在 通知 操作 系统 阻塞 线程 之 前 加 入 一 段 目 旋 等 得 过 程 ， 避 人 免 频 莹 地 
切入 到 核心 态 之 中 。 


除了 synchronized 之 外 ， 我 们 还 可 以 使 用 java.util.concurrent (下 文 
称 J.U.C) 包 中 的 重 入 锁 (ReentrantLock) 来 实现 同步 ， 在 基本 用 法 
上 ，ReentrantLock 与 synchronized 很 相似 ， 他 们 都 具备 一 样 的 线程 重 入 
特性 ， 只 是 代码 写法 上 有 点 区 别 ， 一 个 表现 为 API 层 面 的 互 斥 锁 
Wock0 和 unlock(0) 方 法 配合 tryfinally 语 句 块 来 完成 ) ， 另 一 个 表现 为 
原生 语法 层面 的 互 不 锁 。 不 过 ， 相 比 synchronized,ReentrantLock 增 加 了 
一 些 高 级 功能 ， 主 要 有 以 下 3 项 : 等 待 可 中 断 、 可 实现 公平 锁 ， 以 及 锁 


可 以 绑 定 多 个 条 件 。 


等 待 可 中 断 是 指 当 持 有 锁 的 线程 长 期 不 释放 锁 的 时 候 ， 正 在 等 待 
的 线程 可 以 选择 放弃 等 待 ， 改 为 处 理 其 他 事情 ， 可 中 断 特 性 对 处 理 执 
行 时间 非 常 长 的 同步 块 很 有 帮助 。 


公平 锁 是 指 多 个 线程 在 等 待 同一 个 锁 时 ， 必 须 按照 申请 锁 的 时 间 
顺序 来 依次 获得 锁 ， 而 非 公平 锁 则 不 保证 这 一 点 ， 在 锁 被 释放 时 ， 任 
何 一 个 等 行 锁 的 线程 都 有 机 会 获得 锁 。synchronized 中 的 锁 征 非 公 平 
的 ，ReentrantLock 稚 认 情 况 下 也 是 非 公平 的 ， 但 可 以 通过 市 布尔 值 的 
构造 画 数 要 求 使 用 公平 锁 。 


锁 绑 定 多 个 条 件 是 指 一 个 ReentrantLock 对 象 可 以 同时 绑 定 多 个 
Condition 对 象 ， 而 在 synchronized 中 ， 锁 对 象 的 wait0 和 notify0) 或 
notifyAl10 方 法 可 以 实现 一 个 隐 含 的 条 件 ， 如 宁 要 和 多 于 一 个 的 条 件 天 
联 的 时 候 ， 就 不 得 不 额外 地 添加 一 个 锁 ， 而 ReentrantLock 则 无 须 这 样 
做 ， 只 需要 多 次 调用 newCondition(0) 方 法 即 可 。 


如 果 需 要 使 用 上 述 功 能 ， 选 用 ReentrantLock 是 一 个 很 好 的 选择 ， 
那 如 果 是 基于 性 能 考虑 呢 ? 关于 synchronized 和 ReentrantLock 的 性 能 问 
题 ，Brian Goetz 对 这 两 种 锁 在 JDK 1.5 与 单 核 处 理 器 ， 以 及 JDK 1.5 与 双 
Xeon 处 理 吉 环 境 下 做 了 一 组 吞吐 量 对 比 的 实验 由 ， 实 验 结果 如 图 13-1 
和 图 13-2 所 示 。 
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13-1 JDK 1.5、 单 核 处 理 器 下 两 种 锁 的 吞吐 量 对 比 


从 图 13-1 和 图 13-2 可 以 看 出 ， 多 线程 环境 下 synchronized 的 否 吐 量 
下 降 得 非常 严重 ， 而 ReentrantLock 则 能 基本 保持 在 同一 个 比较 稳定 的 
水 平 上 。 与 其 说 ReentrantLock 性 能 好 ， 还 不 如 说 synchronized 还 有 非常 
大 的 优化 余地 。 后 续 的 技术 发 展 也 证 明了 这 一 点 ，JDK 1.6 中 加 入 了 很 
多 针对 锁 的 优化 措施 〈13.3 克 我 们 就 会 讲解 这 些 优 化 措施 ) ，JDK 1.6 
发 布 之 后 ， 人 们 就 发 现 synchronized 与 ReentrantLock 的 性 能 基本 上 是 完 
全 持平 『。 因 此 ， 如 果 读 者 的 程序 是 使 用 JDK 1.6 或 以 上 部 署 的 话 ， 人 性 
能 因素 就 不 再 是 选择 ReentrantLock 的 理由 了 ， 虚 拟 机 在 未 来 的 性 能 改 
进 中 肯定 也 会 更 加 偏向 于 原生 的 synchronized， 所 以 还 是 提倡 在 
synchronized 能 实现 需求 的 情况 下 ， 优 先 考 虚 使 用 synchronized 来 进行 
同步 。 


Dual XeonHT (Linux) 


Throughput 


Threads 


图 13-2 JDK 1.5、 双 Xeon 处 理 器 下 两 种 锁 的 吞吐 量 对 比 


2. 非 阻塞 同步 


互 不 同步 最 主要 的 问题 就 是 进行 线程 阻塞 和 响 醒 所 带 来 的 性 能 问 
题 ， 因 此 这 种 同步 也 称 为 阻塞 同步 (Blocking Synchronization) 。 从 处 
理 问 题 的 方式 上 说 ， 互 斥 同 步 属 于 一 种 悲观 的 并 发 策略 ， 总 是 认为 只 
要 不 去 做 正确 的 同步 措施 (例如 加 锁 ， 那 就 肯定 会 出 现 问题 ， 无 论 
共享 数据 是 否 真 的 会 出 现 竞争 ， 它 都 要 进行 加 锁 (这 里 讨论 的 是 概念 
模型 ， 实 际 上 虚拟 机 会 优化 掉 很 大 一 部 分 不 必要 的 加 锁 ) 、 用 户 态 核 
心态 转换 、 维 护 锁 计 数 器 和 检查 是 否 有 被 阻塞 的 线程 需要 唤醒 等 损 
作 。 随 着 硬件 指令 集 的 发 展 ， 我 们 有 了 另外 一 个 选择 : 基于 冲突 检测 
的 乐观 并 发 策略 ， 通 俗 地 说 ， 就 是 移 进行 操作 ， 如 果 没 有 其 他 线程 争 
用 共享 数据 ， 那 操作 就 成 功 了 ; 如 果 共 享 数 据 有 和 争 用 ， 产生 了 冲突 ， 
那 就 再 采取 其 他 的 补偿 措施 (最 常见 的 补偿 措施 就 是 不 断 地 重 试 ， 直 
到 成 功 为 止 ) ， 这 种 乐观 的 并 发 策略 的 许多 实现 都 不 需要 把 线程 挂 
起 ， 因 此 这 种 同步 操作 称 为 非 阻 塞 同 步 (Non-Blocking 


Synchronization ) 9 


为 什么 笔者 说 使 用 乐观 并 发 策略 需要 “硬件 指令 集 的 发 展 "才能 进 
行 呢 ? 因为 我 们 需要 操作 和 冲突 检测 这 两 个 步 又 具备 原子 性 ， 靠 什么 
来 保证 呢 ? 如 采 这 里 再 使 用 互 乒 同 步 来 你 证 吏 失 去 意义 了 ， 所 以 我 们 
只 能 靠 硬 件 来 完成 这 件 事 情 ， 硬 件 保 证 一 个 从 语义 上 看 起 来 需要 多 次 
操作 的 行为 只 通过 一 条 处理 如 指令 束 能 完成 ， 这 类 指令 第 用 的 有 : 


测试 并 设置 (Test-and-Set) 。 

获取 并 增加 (Fetch-and-Increment) 。 

交换 (Swap) 。 

比较 并 交换 〈Compare-and-Swap， 下 文 称 CAS) 。 


加 载 链接 /条 件 存 储 (Load-Linked/Store-Conditional， 下 文 称 
LL/SC) 。 


其 中 ， 前 面 的 3 条 是 20 世 纪 吏 已 经 存在 于 大 多 数 指令 集 之 中 的 处 理 
需 指 令 ， 后 面 的 两 条 是 现代 处 理 器 新 增 的 ， 而 且 这 两 条 指令 的 目的 和 
功能 是 类 似 的 。 在 IA64、x86 指 令 集中 有 cmpxchg 指 令 完成 CAS 功 能 ， 
在 sparc-TSO 也 有 casa 指 令 实现 ， 而 在 ARM 和 PowerPC 架 构 下 ， 则 需要 
使 用 一 对 ldrex/strex 指 令 来 完成 LL/SC 的 功能 。 


CAS 指 令 需要 有 3 个 操作 数 ， 分 别 是 内 存 位 置 (在 Java 中 可 以 简单 
理解 为 变量 的 内 存 地 址 ， 用 V 表 示 ) 、 旧 的 预期 值 (用 A 表示 ) 和 新 值 
(用 BB 表示 ) 。CAS 指 令 执行 时 ， 当 且 仅 当 V 符 合 旧 预期 值 A 时 ， 处 理 
器 用 新 值 B 更 新 V 的 值 ， 否 则 它 就 不 执行 更 新 ， 但 是 无 论 是 否 更 新 了 V 
的 值 ， 都 会 返回 V 的 旧 值 ， 上 述 的 处 理 过 程 是 一 个 原子 操作 。 


在 JDK 1.5 之 后 ，Java 程 序 中 才 可 以 使 用 CAS 操 作 ， 该 操作 由 
sun.misc.Unsafe 类 里 面 的 compareAndSwapIntO 和 


compareAndSwapLongO 等 儿 个 方法 包装 提供 ， 虚 拟 机 在 内 部 对 这 些 方 
法 做 了 特殊 处 理 ， 即 时 编译 出 来 的 结果 残 是 一 条 平台 相关 的 处 理 需 


CAS 指 令 ， 没 有 方法 调用 的 过 程 ， 或 者 可 以 认为 是 无 条 件 内 联 进去 了 
国 。 


由 于 Unsafe 类 不 是 提供 给 用 户 程序 调用 的 类 (Unsafe.getUnsafe() 
的 代码 中 限制 了 只 有 启动 类 加 载 器 (Bootstrap ClassLoader) 加 载 的 
Class 才 能 访问 它 ) ， 因 此 ， 如 有 果 不 采 用 反射 手段 ， 我 们 只 能 通过 其 他 
的 Java API 来 间接 使 用 它 ， 如 J.U.C 包 里 面 的 整数 原子 类 ， 其 中 的 
compareAndSet() 和 getAndIncrement() 等 方法 都 使 用 了 Unsafe 类 的 CAS 
操作 。 


我 们 不 妨 拿 一 段 在 第 12 革 中 没有 解决 的 问题 代码 来 看 看 如 何 使 用 
CAS 操 作 来 避免 阻塞 同步 ， 代 码 如 代码 清单 12-1 所 示 。 我 们 曾经 通过 
这 段 20 个 线程 目 增 10000 次 的 代码 来 证 明 volatile 变 量 不 具备 原子 性 ， 那 
么 如 何 才能 让 它 具 备 原 子 性 呢 ? 把 "race++" 操 作 或 increase() 方 法 用 同 
步 块 包 右 起 来 当然 是 一 个 办 法 ， 但 是 如 果 改 成 如 代码 请 单 13-4 所 示 的 
代码 ， 那 效率 将 会 提高 许多 。 


代码 清单 13-4 ”Atomic 的 原子 自 增 运算 


/x 
*Atomic 变 量 自 增 运算 测试 
窒 


*@author zzm 
办 


public class AtomicTestt{ 

public static AtomicInteger race=new AtomicInteger (0); 
public static void increase()t{ 
race.incrementAndGet(); 

} 

private static final int THREADS COUNT=20; 
public static void main (String[]args) throws Exception{ 
Thread[]threads=new Thread[THREADS_COUNT ] ; 
for (int i=0; i<THREADS COUNT; i++) { 
threads[i]=new Thread (new Runnable(){ 
Q@Override 

public void run()t{ 

for (int i=0; i<10000; i++) { 

increase(); 

} 

} 

}); 

threads[i].start(); 

} 

while (Thread.activeCount()>1) 
Thread.yield( ); 

System.out.println (race) ; 

} 

} 


运行 结 采 如 下 : 


200000 


使 用 AtomicInteger 代 和 蔡 int 后 ， 程 序 输 出 了 正确 的 结果 ， 一 切 都 要 
归功 于 incrementAndGet0) 方 法 的 原子 性 。 它 的 实现 其 实 非常 答 单 ， 如 
代码 清单 13-5 所 示 。 


代码 清单 13-5”incrementAndGet(O 方 法 的 JDK 源 码 


A 
*Atomically increment by one the current value. 
*Q@return the updated value 


public final int incrementAndGet(){ 
for (; ) { 

int current=get(); 

int next=current+1; 

if (compareAndSet (current,next) ) 
return next; 


incrementAndGet() 方 法 在 一 个 无 限 循 环 中 ， 不 断 和 尝试 将 一 个 比 当 
前 值 大 1 的 新 值 赋 给 上 自己。 如 果 失 败 了 ， 那 说 明 在 执行 “获取 -设置 ” 操 
作 的 时 候 值 已 经 有 了 修改 ， 于 是 再 次 循环 进行 下 一 次 操作 ， 直 到 设置 
成 功 为 止 。 


尽管 CAS 看 起 来 很 美 ， 但 显然 这 种 操作 无 法 涵盖 互 不 同步 的 所 有 
使 用 场景 ， 并 且 CAS 从 语义 上 来 说 并 不 是 完美 的 ， 存 在 这 样 的 一 个 逻 
辑 漏洞 : 如 果 一 个 变量 V 初 次 读 取 的 时 候 是 A 值 ， 并 且 在 准备 赋值 的 时 
候 检 查 到 它 仍然 为 A 值 ， 那 我 们 就 能 说 它 的 值 没 有 被 其 他 线程 改变 过 
了 吗 ? 如 果 在 这 段 期 间 它 的 值 曾经 被 改 成 了 B， 后 来 又 被 改 回 为 A， 那 
CAS 操 作 束 会 误 认 为 它 从 来 没有 被 改变 过 。 这 个 漏洞 称 为 CAS 操 作 
的 "ABA" 问 题 。J.U.C 包 为 了 解决 这 个 问题 ， 提 供 了 一 个 带 有 标记 的 原 
子 引 用 类 "AtomicStampedReference"， 它 可 以 通过 控制 变量 值 的 版 本 来 
保证 CAS 的 正确 性 。 不 过 目前 来 说 这 个 类 比较 “鸡肋 >， 大 部 分 情况 下 
ABA 问 题 不 会 影响 程序 并 发 的 正确 性 ， 如 果 需 要 解决 ABA 冲 题 ， 改 用 
传统 的 互 不 同步 可 能 会 比 原子 类 更 高 效 。 


3. 无 同步 方案 


要 保证 线程 安全 ， 并 不 是 一 定 束 要 进行 同步 ， 两 者 没有 因 采 天 
系 。 同 步 只 是 保 证 共 至 数据 争 用 时 的 正确 性 的 手段 ， 如 琳 一 个 方法 本 
来 束 不 涉及 共 至 数据 ， 那 它 目 然 束 无 须 任 何 同步 措施 去 你 证 正确 性 ， 
因此 会 有 一 些 代 码 天 生 束 是 线程 安全 的 ， 笔 者 侧 单 地 介绍 其 中 的 两 


可 重 入 代码 (Reentrant Code) : 这 种 代码 也 叫做 纯 代 码 (Pure 
Code) ， 可 以 在 代码 执行 的 任何 时 刻 中 断 它 ， 转 而 去 执行 男 外 一 段 代 
码 (包括 递归 调用 它 本 身 ) ， 而 在 控制 权 返 回 后 ， 原 来 的 程序 不 会 出 
现任 何 错误 。 相 对 线程 安全 来 说 ， 可 重 入 性 是 更 基本 的 特性 ， 它 可 以 
保证 线程 安全 ， 即 所 有 的 可 重 入 的 代码 都 是 线程 安全 的 ， 但 是 并 非 所 
有 的 线程 安全 的 代码 都 是 可 重 入 的 。 


可 重 入 代码 有 一 些 共同 的 特征 ， 例 如 不 依赖 存储 在 堆 上 的 数据 和 
公用 的 系统 资源 、 用 到 的 状态 量 都 由 参数 中 传 入 、 不 调用 非 可 重 入 的 
方法 等 。 我 们 可 以 通过 一 个 人 简单 的 原则 来 判断 代码 是 否 具 备 可 重 入 
性 :如 采 一 个 方法 ， 它 的 返回 结果 是 可 以 预测 的 ， 只 要 输入 了 相同 的 
数据 ， 束 都 能 返回 相同 的 结 末 ， 那 它 整 满足 可 重 入 性 的 要 求 ， 当 然 也 
忠 是 线程 安全 的 。 


线程 本 地 存储 (Thread Local Storage) : 如 果 一 段 代码 中 所 需要 
的 数据 必须 与 其 他 代码 共 吾 ， 那 就 看 看 这 些 共享 数据 的 代码 是 否 能 保 
证 在 同一 个 线程 中 执行 ? 如 果 能 保证 ， 我 们 束 可 以 把 共 至 数据 的 可 见 
范围 限制 在 同一 个 线程 之 内 ， 这 样 ， 无须 同 步 也 能 保证 线程 之 间 不 出 
现 数据 争 用 的 问题 。 


符合 这 种 特点 的 应 用 并 不 少见 ， 大 部 分 使 用 消费 队列 的 架构 模式 
(如 “生产 者 -消费 者 ”模式 ) 都 会 将 产品 的 消费 过 程 尽 量 在 一 个 线程 中 
请 费 完 ， 其 中 最 重要 的 一 个 应 用 实例 就 是 经 典 Web 交 互 模型 中 的 “一 个 
请 求 对 应 一 个 服务 器 线程 ” (Thread-per-Request) 的 处 理 方式 ， 这 种 处 
理 方式 的 广泛 应 用 使 得 很 多 Web 服 务 端 应 用 都 可 以 使 用 线程 本 地 存储 
来 解决 线程 安全 问题 。 


Java 语 言 中 ， 如 果 一 个 变量 要 被 多 线程 访问 ， 可 以 使 用 volatile 关 
键 字 声明 它 为 “ 易 变 的 >; 如果 一 个 变量 要 被 某 个 线程 独 享 ，Java 中 就 
没有 类 似 C++ 中 _ declspec (thread) [这 样 的 关键 字 ， 不 过 还 是 可 以 
通过 java.lang.ThreadLocal 类 来 实现 线程 本 地 存储 的 功能 。 每 一 个 线程 
的 Thread 对 象 中 都 有 一 个 ThreadLocalMap 对 象 ， 这 个 对 象 存储 了 一 组 
以 ThreadLocal.threadLocalHashCode 为 键 ， 以 本 地 线程 变量 为 值 的 K-V 
值 对 ，ThreadLocal 对 象 就 是 当前 线程 的 ThreadLocalMap 的 访问 入 口 ， 
每 一 个 ThreadLocal 对 象 都 包 合 了 一 个 独一无二 的 threadLocalHashCode 
值 ， 使 用 这 个 值 就 可 以 在 线程 K-V 值 对 中 找 回 对 应 的 本 地 线程 变量 。 


[1] 本 例 中 的 数据 及 图 片 来 源 于 Brian Goetz 为 IBM developerWorks 撰 写 
的 论文 : 《Java theory and practice:More flexible,scalable locking in JDK 
5.0》， 原 文 地 址 是 : http://www.ibm.com/developerworks/java/library/j- 
jtp10264/?S_TACT=105AGX52&S_CMP=cn-a-j ° 

[这 种 被 虚拟 机 特殊 处 理 的 方法 称 为 固有 函数 (Intrinsics) ， 类 似 的 
固有 函数 还 有 Math.sin0) 等 。 

[3 在 Visual C++ 中 是 " declspec (thread) "关键 字 ， 而 在 GCC 中 


是 " thread"。 


13.3” 锁 优化 


高 效 并 发 是 从 JDK 1.5 到 JDK 1.6 的 一 个 重要 改进 ，HotSpot 虚 拟 机 
开发 团队 在 这 个 版 本 上 花费 了 大 量 的 精力 去 实现 各 种 锁 优化 技术 ， 如 
适应 性 自 旋 (Adaptive Spinning) 、 锁 消除 (Lock Elimination) 、 锁 
粗 化 (Lock Coarsening) 、 轻 量 级 锁 (Lightweight Locking) 和 偏向 锁 
(Biased Locking) 等 ， 这 些 技术 都 是 为 了 在 线程 之 间 更 高 效 地 共享 数 
据 ， 以 及 解决 竞争 问题 ， 从 而 提高 程序 的 执行 效率 。 


13.3.1 目 旋 锁 与 目 适应 目 旋 


前 面 我 们 讨论 互 不 同步 的 时 候 ， 提 到 了 互 不 同步 对 性 能 最 大 的 影 
啊 是 阻塞 的 实现 ， 挂 起 线程 和 恢复 线程 的 操作 都 需要 转 入 内 核 态 中 完 
成 ， 这 些 操作 给 系统 的 并 发 性 能 市 来 了 很 大 的 压力 。 同 时 ， 虚 拟 机 的 
开发 团队 也 注意 到 在 许多 应 用 上 ， 共 至 数据 的 锁定 状态 只 会 持续 很 短 
的 一 段 时 间 ， 为 了 这 上段 时 间 去 挂 起 和 恢复 线程 并 不 值得 。 如果 物理 机 
絮 有 一 个 以 上 的 处 理 絮 ， 能 让 两 个 或 以 上 的 线程 同时 并 行 执行 ， 我 们 
束 可 以 让 后 面 请 求 锁 的 那个 线程 “ 稍 等 一 下 ”， 但 不 放弃 处 理 器 的 执行 
时 间 ， 看 看 持 有 锁 的 线程 是 否 很 快 束 会 释放 锁 。 为 了 让 线程 等 每 ,我 
们 只 需 让 线程 执行 一 个 忙 循环 ( 自 旋 ) ， 这 项 技术 就 是 所 谓 的 自 旋 
锁 。 


目 旋 锁 在 JDK 1.4.2 中 就 已 经 引入 ， 只 不 过 默认 是 关闭 的 ， 可 以 使 
用 -XX:+UseSpinning 参 数 来 开启 ， 在 JDK 1.6 中 就 已 经 改 为 默认 开启 
了 。 和 上 自 旋 等 待 不 能 代替 阻塞 ， 且 先 不 说 对 处 理 器 数量 的 要 求 ， 自 旋 等 
待 本 吴 虽 然 避 免 了 线程 切换 的 开销 ， 但 它 是 要 占用 处 理 器 时 间 的 ， 因 
此 ， 如 果 锁 被 占用 的 时 间 很 短 ， 自 旋 等 待 的 效果 就 会 非常 好 ， 反 之 ， 
如 果 锁 被 占用 的 时 间 很 长 ， 那 么 自 旋 的 线程 只 会 白白 消耗 处 理 器 资 
源 ， 而 不 会 做 任何 有 用 的 工作 ， 反 而 会 市 来 性 能 上 的 浪费 。 因 此 ， 自 
旋 等 待 的 时 间 必 须要 有 一 定 的 限度 ， 如 果 自 旋 超 过 了 限定 的 次 数 仍然 
没有 成 功 获 得 锁 ， 就 应 当 使 用 传统 的 方式 去 挂 起 线程 了 。 自 旋 次 数 的 
默认 值 是 10 次 ， 用 户 可 以 使 用 参数 -XX:PreBlockSpin 来 更 改 。 


在 JDK 1.6 中 引入 了 目 适 应 的 目 旋 锁 。 目 适应 意味 着 目 旋 的 时 间 不 
再 固定 了 ， 而 是 由 前 一 次 在 同一 个 锁 上 的 目 旋 时 间 及 锁 的 拥有 者 的 状 
态 来 决定 。 如 有 果 在 同一 个 锁 对 象 上 ， 目 旋 等 竺 刚刚 成 功 获得 过 锁 ， 并 
且 持 有 锁 的 线程 正在 运行 中 ， 那 么 虚拟 机 束 会 认为 这 次 目 旋 也 很 有 可 
能 再 次 成 功 ， 进 而 它 将 允许 目 旋 等 待 持续 相对 更 长 的 有 时间， 比如 100 个 
人 循环。 男 外 ， 如 琳 对 于 茶 个 锁 ， 目 旋 很 少 成 功 获 得 过 ， 那 在 以 后 要 获 
取 这 个 锁 时 将 可 能 省 略 挥 目 旋 过 程 ， 以 避免 浪费 处 理 絮 供 源 。 有 了 目 
适应 目 旋 ， 随 着 程序 运行 和 性 能 监控 信息 的 不 断 完善 ， 虚 拟 机 对 程序 
贷 的 状况 预测 整 会 越 来 越 准确 ， 虚 拟 机 整 会 变 得 越 来 越 “ 耶 明 ”了 。 


13.3.2” 锁 消除 


锁 消 除 是 指 虚 拟 机 即时 编译 右 在 运行 时 ， 对 一 些 代码 上 要 求 同 
步 ， 但 是 被 检测 到 不 可 能 存在 共 至 数据 竞争 的 锁 进 行 消除 。 锁 消除 的 
主要 判定 依据 来 源 于 逃逸 分 析 的 数据 支持 (第 11 章 已 经 讲解 过 逃逸 分 
析 技 术 ) ， 如 有 条 判断 在 一 段 代码 中 ， 堆 上 的 所 有 数据 都 不 会 逃逸 出 去 
从 而 被 其 他 线程 访问 到 ， 那 就 可 以 把 它们 当做 栈 上 数据 对 待 ， 认 为 它 
们 是 线程 私有 的 ， 同 步 加 尔 目 然 束 无 须 进行 。 


也 许 读 者 会 有 疑问 ， 变 量 古 否 逃 竟 ， 对 于 虚拟 机 来 说 需要 使 用 数 
据 流 分 析 来 确定 ， 但 是 程序 员 目 己 应 该 是 很 清楚 的 ， 怎 么 会 在 明知 道 
不 存在 数据 争 用 的 情况 下 有 要求 同步 呢 ? 答案 征 有 许多 同步 措施 并 不 是 
程序 员 目 己 加 入 的 ， 同 步 的 代码 在 Java 程 序 中 的 普 裔 程度 也 许 超 过 了 
大 部 分 读者 的 想象 。 我 们 来 看 看 代码 清单 13-6 中 的 例子 ， 这 段 非常 向 
单 的 代码 仅仅 是 输出 3 个 字符 串 相 加 的 结 有 末 ， 无 论 生 源码 字面 上 还 是 程 
序 语义 上 都 没有 同步 。 


代码 清单 13-6 一 段 看 起 来 没有 同步 的 代码 


public String concatString (String si1, String s2, String s3) { 
return S1+S2+S3; 


我 们 也 知道 ， 由 于 String 是 一 个 不 可 变 的 类 ， 对 字符 串 的 连接 操作 
总 是 通过 生成 新 的 String 对 象 来 进行 的 ， 因 此 Javac 编 译 屡 会 对 String 连 
接 做 自动 优化 。 在 JDK 1.5 之 前 ， 会 转化 为 StringBuffer 对 象 的 连续 
append0) 操 作 ， 在 JDK 1.5 及 以 后 的 版 本 中 ， 会 转化 为 StringBuilder 对 象 
的 连续 append0 操 作 ， 即 代码 清单 13-6 中 的 代码 可 能 会 变 成 代码 清单 
13-7 的 样子 [1 。 


代码 清单 13-7 Javac 转 化 后 的 字符 串 连 接 操 作 


public String concatString (String si1, String s2, String s3) { 
StringBuffer sb=new StringBuffer(); 

sb.append (s1) ; 

sb.append (s2) ; 

sb.append (s3) ; 

return Sb,toString(); 


现在 大 家 还 认为 这 段 代码 没有 涉及 同步 吗 ? 每 个 
StringBufferappend() 方 法 中 都 有 一 个 同步 块 ， 锁 吏 是 sb 对 象 。 虚 拟 机 
观察 变量 sb， 很 快 束 会 发 现 它 的 动态 作用 域 被 限制 在 concatString() 方 
法 内 部 。 也 就 是 说 ，sb 的 所 有 引用 永远 不 会 “ 逃 鸳 ” 到 concatString() 方 法 
之 外 ， 其 他 线程 无 法 访问 到 它 ， 因 此 ， 虽 然 这 里 有 锁 ， 但 是 可 以 被 安 
全 地 消除 掉 ， 在 即时 编译 之 后 ， 这 段 代 码 束 会 忽略 挥 所 有 的 同步 而 直 
接 执 行 了 。 


[1] 客 观 地 说 ， 既 然 谈 到 锁 消除 与 逃逸 分 析 ， 那 虚拟 机 就 不 可 能 是 JDK 
1.5 之 前 的 版 本 ， 实 际 上 会 转化 为 非 线 程 安全 的 StringBuilder 来 完成 字 
符 串 拼接 ， 并 不 会 加 锁 ， 但 这 也 不 影响 笔者 用 这 个 例子 证 明 Java 对 象 
中 同步 的 普遍 性 。 


13.3.3” 锁 粗 化 


原则 上 ， 我 们 在 编写 代码 的 时 候 ， 总 是 推荐 将 同步 块 的 作用 艺 围 
限制 得 尽量 小 一 一 只 在 共 至 数据 的 实际 作用 域 中 才 进 行 同 步 ， 这 样 是 
为 了 使 得 需要 同步 的 操作 数量 尽 可 能 变 小 ， 如 果 存 在 锁 范 争 ， 那 等 往 
锁 的 线程 也 能 尽快 拿 到 锁 。 


大 部 分 情况 下 ， 上 面 的 原则 都 是 正确 的 ， 但 是 如 果 一 系列 的 连续 
操作 都 对 同一 个 对 象 反 复 加 锁 和 解锁 ， 甚 至 加 锁 操 作 是 出 现在 循环 体 
中 的 ， 那 即使 没有 线程 竞争 ， 频 繁 地 进行 互 不 同步 操作 也 会 导致 不 必 
要 的 性 能 损耗 。 


代码 清单 13-7 中 连续 的 append0) 方 法 号 属于 这 类 情况 。 如 采 虚 拟 机 
探测 到 有 这 样 一 串 零 碎 的 操作 都 对 同一 个 对 象 加 锁 ， 将 会 把 加 锁 同 步 
的 范围 扩展 〈 粗 化 ) 到 整个 操作 序列 的 外 部 ， 以 代码 清单 13-7 为 例 ， 
忠 是 扩展 到 第 一 个 append() 操 作 之 前 直至 最 后 一 个 append0) 操 作 之 后 ， 
这 样 只 需要 加 锁 一 次 束 可 以 了 。 


13.3.4， 轻 量 级 锁 


轻 量 级 锁 是 JDK 1.6 之 中 加 入 的 新 型 锁 机 制 ， 它 名 字 中 的 “ 轻 量 
级 ” 征 相 对 于 使 用 操作 系统 互 斤 量 来 实现 的 传统 锁 而 言 的 ， 因 此 传统 的 
锁 机 制 束 称 为 < 重量 级 ” 锁 。 首 先 需 要 强调 一 点 的 是 ， 轻 量 级 锁 并 不 是 
用 来 代替 重量 级 锁 的 ， 它 的 本 意 是 在 没有 多 线程 竞争 的 前 提 下 ， 减 少 
传统 的 重量 级 锁 使 用 操作 系统 互 不 量 产 生 的 性 能 消耗 。 


要 理解 轻 量 级 锁 ， 以 及 后 面 会 讲 到 的 偏向 锁 的 原理 和 运作 过 程 ， 
必须 从 HotSpot 虚 拟 机 的 对 象 《对象 头 部 分 ) 的 内 存 布局 开始 介绍 。 
HotSpot 虚 拟 机 的 对 象 头 (Object Header) 分 为 两 部 分 信息 ， 第 一 部 分 
用 于 存储 对 象 自身 的 运行 时 数据 ， 如 哈 希 码 (HashCode) 、GC 分 代 年 
龄 (Generational GC Age) 等 ， 这 部 分 数据 的 长 度 在 32 位 和 64 位 的 虚拟 
机 中 分 别 为 32bit 和 64bit， 官 方 称 它 为 "Mark Word"， 它 是 实现 轻 量 级 锁 
和 偏向 锁 的 关键 。 男 外 一 部 分 用 于 存储 指向 方法 区 对 象 类 型 数据 的 指 
针 ， 如 果 是 数组 对 象 的 话 ， 还 会 有 一 个 额外 的 部 分 用 于 存储 数组 长 
度 。 


对 象 头 信息 是 与 对 象 目 身 定义 的 数据 无 天 的 额外 存储 成 本 ， 考 虑 
到 虚拟 机 的 空间 效率 ，Mark Word 被 设计 成 一 个 非 国定 的 数据 结构 以 便 
在 极 小 的 空间 内 存储 尽量 多 的 信息 ， 它 会 根据 对 象 的 状态 复 用 自己 的 
存储 空间 。 例 如 ， 在 32 位 的 HotSpot 虚 拟 机 中 对 象 未 被 锁定 的 状态 下 ， 


Mark Word 的 32bit 空 间 中 的 25bit 用 于 存储 对 象 哈 希 码 (HashCode) ， 
4bit 用 于 存储 对 象 分 代 年 龄 ，2bit 用 于 存储 锁 标 志 位 ，1lbit 固 定 为 0， 在 
其 他 状态 〈 轻 量 级 锁定 、 重 量 级 锁定 、GC 标 记 、 可 偏向 ) 下 对 象 的 存 
储 内 容 见 表 13-1 。 


表 13-1 HotSpot 虚拟 机 对 象 头 Mark Word 


存储 内 容 示 志 位 状态 
对 象 哈 希 码 、 对 象 分 代 年 龄 01 未 锁定 
指向 锁 记 录 的 指针 | 00 轻 量 级 锁定 
指向 重量 级 锁 的 指 钊 | 10 膨胀 (重量 级 锁定 ) 


空 ， 不 需要 记录 信息 11 GC 标记 


偏向 线程 ID、 偏向 时 间 蕉 、 对 和 象 分 代 年 龄 可 偏 问 


简单 地 介绍 了 对 象 的 内 存 布局 后 ， 我 们 把 话题 返回 到 轻 量 级 锁 的 
执行 过 程 上 。 在 代码 进入 同步 块 的 时 候 ， 如 果 此 同步 对 象 没有 被 锁定 
( 锁 标志 位 为 “01” 状 态 ) ， 虚 拟 机 首先 将 在 当前 线程 的 栈 帧 中 建立 一 
个 名 为 锁 记录 (Lock Record) 的 空间 ， 用 于 存储 锁 对 象 目前 的 Mark 
Word 的 拷贝 (官方 把 这 份 拷贝 加 了 一 个 Displaced 前 级， 即 Displaced 
Mark Word) ， 这 时 候 线 程 堆 栈 与 对 象 头 的 状态 如 图 13-3 所 示 。 


然后 ， 虚 拟 机 将 使 用 CAS 操 作 尝 试 将 对 象 的 Mark Word 更 新 为 指向 
Lock Record 的 指针 。 如 果 这 个 更 新 动作 成 功 了 ， 那 么 这 个 线程 就 拥有 
了 该 对 象 的 锁 ， 并 且 对 象 Mark Word 的 锁 标 志 位 (Mark Word 的 最 后 
2bit) 将 转变 为 “00”"， 即 表示 此 对 象 处 于 轻 量 级 锁定 状态 ， 这 时 候 线程 
堆栈 与 对 象 头 的 状态 如 图 13-4 所 示 。 


Execution 人 


Stack Object 


Method mark word 
activation 


Lock | displaced hdr 


record owner 


图 13-3 轻 量 级 锁 CAS 操 作 之 前 堆栈 与 对 象 的 状态 中 


Execution 人 


Stack Object 


activation 


DOWDeT 


图 13-4 轻 量 级 锁 CAS 操 作 之 后 堆栈 与 对 象 的 状态 


如 有 果 这 个 更 新 操作 失败 了 ， 虚 拟 机 首先 会 检查 对 象 的 Mark Word 是 
人 否 指 同 当 前 线程 的 栈 帧 ， 如 来 只 说 明 当 前 线程 已 经 拥有 了 这 个 对 象 的 
锁 ， 那 就 可 以 直接 进入 同步 块 继续 执行 ， 否 则 说 明 这 个 锁 对 象 已 经 被 
其 他 线程 抢占 了 。 如 果 有 了 两 条 以 上 的 线程 争 用 同一 个 锁 ， 那 轻 量 级 锁 
号 不 再 有 效 ， 要 膨胀 为 重量 级 馈 ， 锁 标志 的 状态 值 变 为 “10”，Mark 


Word 中 存储 的 束 是 指 癌 重量 级 锁 ( 互 不 量 ) 的 指针 ， 后 面 等 待 锁 的 线 
程 也 要 进入 阻塞 状态 。 


上 面 摘 述 的 是 轻 量 级 锁 的 加 俩 过 程 ， 它 的 解锁 过 程 也 生 通 过 CAS 
操作 来 进行 的 ， 如 果 对 象 的 Mark Word 仍 然 指 向 着 线程 的 锁 记 录 ， 那 就 
用 CAS 操 作 把 对 象 当 前 的 Mark Word 和 线程 中 复制 的 Displaced Mark 
Word 蕉 换 回 来 ， 如 果 珍 换 成 功 ， 整 个 同步 过 程 束 完成 了 。 如 琳 玲 换 失 
败 ， 说 明 有 其 他 线程 尝试 过 获取 该 锁 ， 那 就 要 在 释放 锁 的 同时 ， 唤 醒 
被 挂 起 的 线程 。 


轻 量 级 锁 能 提升 程序 同步 性 能 的 依据 是 “对 于 绝 大 部 分 的 锁 ， 在 整 
个 同步 周期 内 部 是 不 存在 苋 争 的 "， 这 是 一 个 经 验 数 据 。 如 琳 没 有 苋 
争 ， 轻 量 级 锁 使 用 CAS 操 作 人 避免 了 使 用 互 不 量 的 开销 ， 但 如 琳 存 在 锁 
苋 争 ， 除 了 互 不 量 的 开销 外 ， 还 额外 发 生 了 CAS 操 作 ， 因 此 在 有 苋 争 
的 情况 下 ， 轻 量 级 锁 会 比 传统 的 重量 级 锁 更 慢 。 


[1] 图 13-3 和 图 13-4 来 源 于 HotSpot 虚 拟 机 的 一 位 Senior Staff Engineer 


Paul Hohensee 所 写 的 PPT'"The Hotspot Java Virtual Machine"。 


13.3.5 ”偏向 锁 


俩 加 锁 也 是 JDK 1.6 中 引入 的 一 项 锁 优化 ， 它 的 目的 古 消 除数 据 在 
无 竞争 情况 下 的 同步 原 语 ， 进 一 步 提 高 程序 的 运行 性 能 。 如 有 果 说 轻 量 
级 锁 是 在 无 竞争 的 情况 下 使 用 CAS 操 作 去 消除 同步 使 用 的 互 斥 量 ， 那 
俩 癌 锁 束 是 在 无 竞争 的 情况 下 把 整个 同步 都 消除 反 ， 连 CAS 操 作 都 不 
做 了 。 


偏向 锁 的 “ 偏 "?， 就 是 偏心 的 “ 偏 "、 偏 祖 的 “ 偏 "， 它 的 意思 是 这 个 锁 
会 偏 癌 于 第 一 个 获得 它 的 线程 ， 如 有 果 在 接 下 来 的 执行 过 程 中 ， 该 锁 没 
有 被 其 他 的 线程 获取 ， 则 持 有 偏 癌 锁 的 线程 将 永远 不 需要 再 进行 同 
有 


如 果 读 者 读 懂 了 前 面 轻 量 级 锁 中 关于 对 象 凑 Mark Word 与 线程 之 间 
的 操作 过 程 ， 那 偏向 锁 的 原理 理解 起 来 就 会 很 简单 。 假 设 当前 虚拟 机 
启用 了 偏向 锁 (启用 参数 -XX:+UseBiasedLocking， 这 是 JDK 1.6 的 默认 
值 ) ， 那 么 ， 当 锁 对 象 第 一 次 被 线程 获取 的 时 候 ， 虚 拟 机 将 会 把 对 象 
头 中 的 标志 位 设 为 “01”， 即 偏向 模式 。 同 时 使 用 CAS 操 作 把 获取 到 这 个 
锁 的 线程 的 ID 记录 在 对 象 的 Mark Word 之 中 ， 如 果 CAS 操 作成 功 ， 持 有 
偏向 锁 的 线程 以 后 每 次 进入 这 个 锁 相关 的 同步 块 时 ， 虚 拟 机 都 可 以 不 
再 进行 任何 同步 操作 (例如 Locking、Unlocking 及 对 Mark Word 的 


Update 等 ) 。 


当 有 另外 一 个 线程 去 党 试 获取 这 个 锁 时 ， 偏 向 模式 就 宣告 结束 。 
根据 锁 对 象 目 前 是 否 处 于 被 锁定 的 状态 ， 撤 销 偏向 (Revoke Bias) 后 
恢复 到 未 锁定 (标志 位 为 “01”) 或 轻 量 级 锁定 (标志 位 为 “<00”) 的 状 
态 ， 后 续 的 同步 操作 就 如 上 面 介绍 的 轻 量 级 锁 那 样 执行 。 偏 向 锁 、 轻 
量 级 锁 的 状态 转化 及 对 象 Mark Word 的 关系 如 图 13-5 所 示 。 


分 配对 象 


如 果 偏 向 锁 可 用 如 果 偏 向 锁 不 可 用 


0 | epoch | age | 1 | 01 | 晤 果 对 条 末 锁定 >| hash code | age 0 [ol 上 -一 
未 锁定 、 未 偏向 但 是 可 偏向 的 对 象 未 被 锁定 的 ， 不 可 偏向 对 象 
初始 锁定 | | 重 偏向 撤销 偏向 轻 量 级 锁定 递归 锁定 
EE 
thread ID epoch | age |1|01 类 时 对 象 已 信和 > pointer to lock record 00 解锁 
中 果 对 象 已 锁定 
已 偏向 的 、 锁 定 或 未 锁定 的 对 象 人 被 轻 量 级 锁定 的 对 象 
锁定 /解锁 


pointer to heavyweight monitor 
被 重量 级 锁定 的 对 象 


图 13-5 偏 癌 锁 、 轻 量 级 锁 的 状态 转化 及 对 象 Mark Word 的 关系 


偏向 锁 可 以 提高 融 有 同步 但 无 竞争 的 程序 性 能 。 它 同样 是 一 个 带 
有 效益 权衡 (Trade Off) 性 质 的 优化 ， 也 就 是 说 ， 它 并 不 一 定 总 是 对 
程序 运行 有 利 ， 如 果 程 序 中 大 多 数 的 锁 总 是 被 多 个 不 同 的 线程 访问 ， 
那 偏向 模式 就 是 多 余 的 。 在 具体 问题 具体 分 析 的 前 提 下 ， 有 时候 使 用 
参数 -XX:-UseBiasedLocking 来 禁止 偏 品 锁 优化 反而 可 以 提升 性 能 。 


13.4 本 草 小 结 


本 章 介绍 了 线程 安全 所 涉及 的 概念 和 分 类 、 同 步 实现 的 方式 及 虚 
拟 机 的 底层 运作 原理 ， 并 且 介绍 了 虚拟 机 为 了 实现 高 效 并 发 所 采取 的 
一 系列 锁 优 化 措施 。 


许多 质 深 的 程序 员 都 说 过 ， 能 够 写 出 高 伸缩 性 的 并 发 程序 是 一 门 
亏 术 ， 而 了 解 并 发 在 系统 撒 层 是 如 何 实现 的 ， 则 是 掌握 这 门 忆 术 的 前 
是 条 件 ， 也 是 成 长 为 融 级 程序 员 的 必 备 知识 之 一 。 
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JDK 历 史 版 本 轨迹 


编译 Windows 版 的 OpenJDK 


A.1 获取 JDK 源 人 码 


首先 确定 要 使 用 的 JDK 版 本 ，OpenJDK 6 和 OpenJDK 7 都 是 开源 
的 ， 源 码 都 可 以 在 它们 的 主页 (http://openjdk.java.net/) 上 找到 ， 
OpenJDK 6 的 源码 其 实 是 从 OpenJDK 7 的 某 个 基线 中 引出 的 ， 然 后 剥离 
挥 JDK 1.7 相 关 的 代码 ， 从 而 得 到 一 份 可 以 通过 TCK 6 的 JDK 1.6 实 现 ， 
因此 直接 编译 OpenJDK 7 会 更 加 “ 原 汗 原味” 一些， 其 实 这 两 个 版 本 的 


编译 过 程 差 异 并 不 大 。 


获取 源码 有 两 种 方式 。 一 种 是 通过 Mercurial 代 码 版 本 管理 工具 从 
Repository 中 直接 取得 源码 (Repository 地 址 : 
http://hg.openjdk.java.net/jdk7/jdk7) ， 这 是 最 直接 的 方式 ， 从 版 本 管理 
中 看 变更 轨迹 比 看 什么 Release Note 都 来 得 实在 ， 不 过 坏处 自然 是 太 麻 
烦 了 一 些 ， 尤 其 是 Mercurial 远 不 如 SVN、ClearCase 或 CVS 之 类 的 版 本 
控制 工具 那样 普及 。 另 一 种 就 是 直接 下 载 官方 打包 好 的 源码 包 了 ， 可 
以 从 Source Releases 页 面 (地 址 : 
http://download.java.net/openjdk/jdk7/) 取得 打包 好 的 源码 ， 一 般 来 说 
大 概 一 个 月 会 更 新 一 次 ， 虽 然 不 够 及 时 ， 但 的 确 方 便 了 许多 。 笔 者 下 
载 的 是 OpenJDK 7 Early Access Source Build b121 版 ，2010 年 12 月 9 日 发 
布 的 ， 大 概 81.7MB， 解 压 后 约 308MB 。 


A.2 系统 需求 


如 果 可 能 ， 笔 者 建议 尽量 在 Linux 或 Solaris 上 构建 OpenJDK， 这 要 
比 在 Windows 平 台 上 轻松 许多 ， 而 且 网 络 上 能 找到 的 资料 绝 大 部 分 都 
是 在 Linux 上 编译 的 。 如 果 一 定 要 在 Windows 平 台 上 编译 ， 建 议 读者 认 
真 阅读 一 下 源码 中 的 README-builds.html 文 档 (无 论 在 OpenJDK 网 站 
上 还 是 在 下 载 的 源码 包 里 面 都 有 这 份 文档 ) ， 因 为 编译 过 程 中 需要 注 
意 的 细节 非常 多 。 虽 然 不 至 于 像 文 要 上 所 描述 的 *Building the source 


code for the JDK requires a high level of technical expertise.Sun provides 


the source code primarily for technical experts who want to conduct 
research (编译 JDK 需 要 很 高 的 专业 技术 ，Sun 提 供 JDK 源 码 是 为 了 技 
术 专 家 进行 研究 之 用 ) ”那么 夸张 ， 但 是 如 果 读 者 是 第 一 次 编译 ， 那 在 
上 面 耗 费 一 整 天 力 至 更 多 的 时 间 都 很 正常 。 


笔者 在 本 次 实战 中 演示 的 是 在 32 位 Windows 7 平台 下 编译 x86 版 的 
OpenJDK (也 就 是 32 位 的 JDK) ， 如 果 需 要 编译 x64 版 ， 那 这 无 疑问 也 
需要 一 个 64 位 的 操作 系统 。 另 外 ， 编 译 涉及 的 所 有 文件 都 必须 存放 在 
NTFS 格 式 的 文件 系统 中 ， 因 为 FAT32 格 式 无 法 支持 大 小 写 敏 感 的 文件 
和 名。 在 冒 方 文档 上 写 厦 : 编译 至 少 需 要 512MB 的 内 存 和 600MB 的 人 磁 副 
空间 。512MB 的 内 存 基 本 上 也 可 以 凑合 使 用 ， 不 过 600MB 的 磁盘 空间 
仅仅 是 指 存放 OpenJDK 源 码 和 相关 依赖 项 的 空间 ， 要 完成 编译 ， 


600MB 肯 定 是 无 论 如何 都 不 够 的 ， 这 次 实战 中 所 下 载 的 工具 、 依 赖 
项 、 源 码 ， 全 部 安装 、 解 压 完成 最 少 《最少 是 指 只 下 载 C++ 编译 器 ， 


不 下 载 VS 的 IDE) 需要 超过 1GB 的 空间 。 


对 系统 的 最 后 一 点 要 求 束 是 所 有 的 文件 ， 包 括 源码 和 依赖 项 目 ， 
都 不 要 放 在 包含 中 文 或 空格 的 目 隶 里面， 这样 做 不 是 一 定 不 可 以 ， 只 
征 这 样 会 为 后 续 建 立 CYGWIN 环 境 市 来 很 多 额外 的 工作 ， 这 征 由 于 
Linux 和 Windows 的 人 磁盘 路 径 差 别 所 导致 的 ， 我 们 也 没有 必要 给 目 己 找 
碾 烦 。 


A.3 构建 编译 环境 


准备 编译 环境 的 第 一 步 是 去 安装 一 个 CYGWINL。 这 是 一 个 在 
Windows 平 台 下 模拟 Linux 运 行 环境 的 软件 ， 提 供 了 一 系列 的 Linux 命 令 
支持 。 需 要 CYGWIN 的 原因 是 在 编译 中 要 使 用 GNU Make 来 执行 
Makefile 文 件 (C/C++ 程序 员 肯 定 很 熟悉 ， 如 果 只 使 用 Java， 那 把 这 
东西 当做 C++ 版 本 的 ANT 看 待 就 可 以 了 ) 。 安 装 CYGWIN 时 不 能 直接 
默认 安装 ， 因 为 表 A-1 中 所 示 的 工具 都 不 会 进行 默认 安装 ， 但 又 是 编译 

过 程 中 需要 的 ， 因 此 要 在 图 A-1 的 安装 界面 中 进行 手工 选择 。 


表 A-1 需要 手工 选择 安装 的 CYGWIN 工具 


文件 名 分 类 包 描述 
ar.exe Devel binutils The GNU assembler, linker and binary utilities 
make.exe Devel make The GNU version of the "make' utility built for CYGWIN. 
m4.exe Interpreters m4 GNU implementation of the traditional Unix macro processor 
cpio.exe Utils cpio A program to manage archives of files 
gawk.exe Utils awk Pattern-directed scanning and processing language 
file.exe Utils file Determines file type using "magic' numbers 

( 续 ) 
文件 名 分 类 包 描述 


Zip.exe Archive Zip Package and compress (archive) fles 


unzip.exe Archive unzip Extract compressed files in a ZIP archive 
free.exe System Display amount of free and used memory in the system 


CYGWIN 安 装 时 的 定制 包 选 择 界面 如 图 A-1 所 示 : 


EE Cygwin Setup - Select 


Select 
Select packages to instal 


Search | 


Category Eel | De 人 忆 二- Package 
日 局 1 种 Defsmt 

因 Accessibility £7 Default 

日 kdnmin #¥ Default 

YSkip attr, VUtilities for mar 

好 Skip 
YSkip 
Keep 
好 Skip 
YSkip 


cron: Yixie” s cron. 
cygrunsSryY: NT/WCK servi 
1ibattrl: Shared lib fc 


shutdown- Shutdown, ret 


时 时 品 品 吕 对 


syslog-ng: Next generat 
加 chive 入 Default 


- 


4 | I | 
区 ] Hide obsolete packages 


EE | 


图 A-1 CYGWIN 安 装 界面 


建立 编译 环境 的 第 二 步 是 安装 编译 器 。JDK 中 最 核心 的 代码 (Java 
虚拟 机 及 JDK 中 Native 方 法 的 实现 等 ) 是 使 用 C++ 语言 及 少量 的 C 语 言 
编写 的 ， 官 方 文档 中 说 他 们 的 内 部 开发 环境 是 在 Microsoft Visual Studio 
C++2003 (VS2003) 中 进行 编译 ， 同 时 也 在 Microsoft Visual Studio 
C++2010 (VS2010) 中 测试 过 ， 所 以 最 好 只 选择 这 两 个 编译 器 之 一 进 
行 编译 。 如 果 选 择 VS2010， 那 么 在 编译 器 之 中 已 经 包含 了 Windows 
SDK v 7.0a， 否 则 可 能 还 要 目 己 去 下 载 这 个 SDK， 并 且 更 新 
PlatformSDK 目录。 由 于 Visual Studio 2010 的 IDE 是 收费 的 ， 所 以 仅仅 下 


载 了 VS2010 Express 中 提取 出 来 的 C++ 编译 器 ， 这 部 分 是 免费 的 ， 但 单 
独 安装 好 编译 器 比较 麻烦 。 建 议 读 者 选择 使 用 整套 Visual Studio 
C++2010 或 Visual Studio C++2010 Express 版 进行 编译 。 


需要 特别 注意 的 一 点 是 ，CYGWIN 和 VS2010 安 装 之 后 都 会 在 操作 
系统 的 PATH 环境 变量 中 写 入 自己 的 bin 目 录 路 径 ， 必 须 检查 并 保证 
VS2010 的 bin 目 录 一 定 要 在 CYGWIN 的 bin 目 录 之 前 ， 因 为 这 两 个 软件 
的 pin 目 录 之 中 各 自 都 有 个 连接 器 "link.exe"， 但 是 只 有 VS2010 中 的 连接 
器 可 以 完成 OpenJDK 的 编译 。 


准备 JDK 编 译 环境 的 第 三 步 融 是 下 载 一 个 已 经 编译 好 了 的 JDK。 这 
听 起 来 也 许 有 点 滑稽 一 一 要 用 鸡蛋 孵 小 鸡 还 真得 必须 先 养 一 只 母 鸡 
呀 ? 但 仔细 想 想 其 实 这 个 步骤 很 合理 : 因为 JDK 包 含 的 各 个 部 分 
(Hotspot、JDK API、JAXWS、JAXP......) 有 的 是 使 用 C++ 编写 的 ， 
而 更 多 的 代码 则 是 使 用 Java 自 身 实现 的 ， 因 此 编译 这 些 Java 代 码 需要 用 
到 一 个 可 用 的 JDK， 官 方 称 这 个 JDK 为 "Bootstrap JDK'"。 而 编译 


OpenJDK 7 的 话 ，Bootstrap JDK 必 须 使 用 JDK6 Update 14 或 之 后 的 版 


本 ， 笔 者 选用 的 是 JDK6 Update 21。 


最 后 一 个 步骤 是 下 载 一 个 Apache ANTJDK 中 Java 代 码 部 分 都 是 使 
用 ANT 脚 本 进行 编译 的 ，ANT 版 本 要 求 在 1.6.5 以 上 ， 这 部 分 是 Java 的 
基础 知识 ， 对 本 书 的 读者 来 说 应 该 没有 难度 ， 笔 者 不 再 详 述 。 


[1JCYGWIN 下 载 地 址 : http://www.cygwin.com/。 


A.4 准备 依赖 项 


前 面 说 过 ，OpenJDK 中 开放 的 源码 并 没有 达到 100%， 还 有 极 少量 
的 无 法 开源 的 产权 代码 存在 。OpenJDK 承 诺 日 后 将 逐步 使 用 开源 实现 
来 替换 掉 这 部 分 产权 代码 ， 但 至 少 在 今天 ， 编 译 JDK 还 需要 这 部 分 闭 
源 包 ， 官 方 称 之 为 "JDK Plug"11， 它 们 从 前 面 的 Source Releases 页 面 就 
可 以 下 载 到 。 在 Windows 平 台 的 JDK Plug 是 以 Jar 包 的 形式 提供 的 ， 通 


过 下 面 这 条 命令 可 以 安装 它 : 


java-jar jdk-7-ea-plug-b121-windows-i586-09_dec_2010.]jar 


运行 后 将 会 显示 如 图 A-2 所 示 的 协议 ， 点 击 ACCEPT 接 受 协 议 ， 然 
后 把 Plug 安装 到 指定 目录 即 可 。 安 装 完毕 后 建立 一 个 环境 变 
量 "ALT_BINARY _PLUGS_PATH"， 变 量 值 为 此 JDK Plug 的 安装 路 径 ， 
后 面 编译 程序 时 需要 用 到 它 。 


除了 要 用 到 JDK Plug 外 ， 编 译 时 还 需要 引用 JDK 的 运行 时 包 ， 这 
个 是 编译 JDK 中 用 Java 代 码 编写 的 那 部 分 所 需要 的 ， 如 果 仅 仅 是 想 编 
译 一 个 HotSpot 虚 拟 机 的 话 则 可 以 不 用 。 官 方 文档 把 这 部 分 称 
为 "Optional Import JDK"， 可 以 直接 使 用 前 面 Bootstrap JDK 的 运行 时 
包 ， 我 们 需要 建立 一 个 名 为 "ALT_JDK_IMPORT_PATH" 的 环境 变量 指 
向 JDK 的 安装 目录 。 


| 
lBinary License for OpenJDK 


Sun Microsystems, Inc Binary Code License Agreement 

| 

SUN MICROSYSTEMS, INC. CSUN) IS WILLING TO LICENSE THE SOFTWARE TO YOU 
ONLY UPON THE CONDITION THAT YOU ACCEPT ALL OF THE TERMS CONTAINED IN THIS 
BINARY CODE LICENSE AGREEMENT (AGREEMENT ) PLEASE READ THE AGREEMENT 
ICAREFULLY. BY DOWNLOADING OR INSTALLING THIS SOFTWARE, YOU ACCEPT THE 
FULL 

TERMS OF THIS AGREEMENT 


| 
二 


A-2 JDK Plug 安 装 协议 


然后 是 安装 一 个 大 于 2.3 版 的 FreeTypel! 耻 ， 这 是 一 个 免费 的 字体 泻 
染 库 ，JDK 的 Swing 部 分 和 JConsole 这 类 工具 要 使 用 到 它 。 安 狠 好 后 建 
并 两 个 环境 变 
量 "ALT_FREETYPE_LIB_PATH" 和 "ALT_FREETYPE_HEADERS_PAT 
H"， 分 别 指向 FreeType 安 装 上 日 录 下 的 bin 目 录 和 include 目 录 。 男 外 还 有 
一 扩 冒 方 文档 没有 提 到 但 必须 要 做 的 事情 是 把 FreeType 的 bin 目 录 加 入 
到 PATH 环境 变量 


然后 下 载 Microsoft DirectX 9.0 SDK (Summer 2004) ， 安 装 后 大 
约 有 298MB， 在 微软 官方 网 站 上 搜索 一 下 就 可 以 找到 下 载 地 址 ， 它 是 


免费 的 。 安 装 后 建立 环境 变量 "ALT_DXSDK_PATH" 指 向 DirectX 9.0 


然后 去 寻找 一 个 名 为 "MSVCR100.DLL" 的 动态 链接 库 ， 如 果 读 者 
在 前 面 安装 了 全 套 的 Visual Studio 2010， 那 这 个 文件 在 本 机 就 能 找 
到 ， 人 否则 上 网 搜索 一 下 也 能 找到 单独 的 下 载 地 址 ， 大 概 有 744KB。 建 
立 环境 变量 "ALT_MSVCRNN_DLL PATH" 指向 这 个 文件 所 在 的 目录 。 
如 果 读 者 选择 的 是 VS2003， 这 个 文件 名 应 当 为 "MSVCR73.DLL"， 应 
该 在 很 多 软件 中 都 包含 有 这 个 文件 ， 如 果 找 不 到 的 话 ， 前 面 下 载 
的 "Bootstrap JDK" 的 bin 目 录 中 应 该 也 有 一 个 ， 直 接 拿 来 用 吧 。 


[1] 在 2011 年 ，JDK plug 已 经 不 再 需要 了 ， 但 在 笔者 写本 次 实战 时 使 用 
的 2010 年 12 月 9 日 发 布 的 OpenJDK b121 版 还 是 需要 这 些 JDK plug 。 


[2]FreeType 主 页 : http:/www.freetype.org/。 


A.5 进行 编译 


现在 需要 下 载 的 编译 环境 和 依赖 项 目 都 准备 齐全 了 ， 最 后 我 们 还 
需要 对 系统 做 一 些 设置 以 便 编译 能 够 顺利 通过 


首先 执行 VS2010 中 的 VCVARS32.BAT， 这 个 批 处 理 文件 的 目的 主 
要 是 设置 INCLUDE、LIB 和 PATH 这 几 个 环境 变量 ， 如 果 和 笔者 一 样 只 
是 下 载 了 编译 器 的 话 则 需要 手工 设置 它们 ， 各 个 环境 变量 的 设置 值 可 
以 参考 下 面 给 出 的 代码 清单 A-1 中 的 内 容 。 批 处 理 运 行 完 之 后 建 
YI"ALT_ COMPILER_PATH" 环 境 变量 让 Makefile 知 道 在 哪里 可 以 找到 


编译 器 。 


再 建立 "ALT_BOOTDIR" 和 "ALT_JDK_IMPORT_PATH" 两 个 环境 

量 指向 前 面 提 到 的 JDK 1.6 的 安 效 目录。 建立"ANT_HOME" 指 癌 
Apache ANT 的 安装 目 孙 。 建 立 的 环境 变量 很 多 ， 为 了 避免 遗漏 ， 笔 者 
写 了 一 个 批 处 理 文件 以 供 读者 参考 ， 如 代码 清单 A-1 所 示 。 


代码 清单 A-1 环境 变量 设置 


SET ALT_BOOTDIR=D:/_DevSpace/JDK 1.6.0 21 

SET ALT_BINARY_PLUGS_PATH=D:/jdkBuild/jdk7plug/openjdk-binary- 
plugs 

SET ALT_JDK_IMPORT_PATH=D:/ DevSpace/JDK 1.6.0 21 

SET ANT_HOME=D:/jdkBuild/apache-ant-1.7.0 

SET ALT_MSVCRNN_DLL_PATH=D:/jdkBuild/msvcr100 

SET ALT_DXSDK_PATH=D:/jdkBuild/msdxsdk 


SET ALT_COMPILER_PATH=D:/jdkBuild/vcpp2010.Xx86/bin 

SET ALT_FREETYPE_HEADERS_PATH=D:/jdkBuild/freetype-2.3.5-1- 
bin/include 

SET ALT_FREETYPE_LIB PATH=D:/jdkBuild/freetype-2.3.5-1-bin/bin 

SET INCLUDE=D:/jdkBuild/vcpp2010.x86/include.; 
D:/jdkBuild/vcpp2010.x86/sdk/Include; %INCLUDE% 

SET LIB=D:/jdkBuild/vcpp2010.x86/1ib; 
D:/jdkBuild/vcpp2010.x86/sdk/Lib; %LIB% 

SET LIBPATH=D:/jdkBuild/vcpp2010.x86/1ib; %LIB% 

SET PATH=D:/jdkBuild/vcpp2010.x86/bin; 
D:/jdkBuild/vcpp2010.x86/d1l1/x86; 
D:/Software/OpenSource/cygwin/bin; %ALT_FREETYPE_LIB_ PATH%; %PATH% 


和 最 后 还 需要 进行 两 项 调整 ， 虽 然 ， 官 方 文 档 没 有 说 明 这 两 项 ， 但 
是 必须 要 做 完 才 能 保证 编译 过 程 的 顺利 通过 : 一 项 是 取消 环境 变量 
JAVA_HOME， 这 点 很 向 单 ， 另 外 一 项 是 尽量 在 英文 的 操作 系统 上 编 
译 ， 如 果 不 能 在 英文 的 系统 上 编译 就 把 系统 的 文字 格式 调整 为 “英语 
(美国 ) ”， 在 控制 面板 -区 域 和 语言 选项 的 第 一 个 页 签 中 可 以 设置 。 
如 果 这 个 设置 还 不 能 更 改 就 建立 一 个 "BUILD_CORBA" 的 环境 变量 
将 值 设 置 为 false， 取 消 编 译 CORBA 部 分 ， 否 则 JavaIDL (idlj.exe) 为 
*.id] 文 件 生 成 CORBA 适 配器 代码 的 时 候 会 产生 中 文 注 释 ， 而 这 些 中 文 
注释 会 因为 字符 集 的 问题 而 导致 编译 失败 。 


完成 了 上 述 的 准备 工作 之 后 ， 我 们 终于 可 以 开始 编译 了 。 进 入 控 
制 台 (Cmd.exe) 后 运行 刚才 准备 好 的 设置 环境 变量 的 批 处 理 文件 ， 
然后 输入 bash 进 入 Bourne Again Shell 环 境 (sh 或 ksh 也 可 以 ) 。 如 果 
JDK 的 安装 源码 中 存在 "jdk_generic_profile.sh" 这 个 Shell 脚 本 ， 先 执行 

， 笔 者 下 载 的 OpenJDK 7 B121 版 没有 这 个 文件 了 ， 所 以 直接 输入 


make sanity 来 检查 我 们 前 面 所 做 的 设置 是 否 全 部 正确 。 如 有 果 一 切 顺 
利 ， 那 么 几 秒 钟 之 后 会 有 类 似 代码 清单 A-2 所 示 的 输出 。 


代码 清单 A-2 make sanity 检 查 


D:\jdkBuild\openjdk7> bash 

bash-3.2$make sanity 

cygwin warning: 

MS-DOS style path detected:C:/Windows/system32/wscript.exe 

Preferred POSIX equivalent 
is:/cygdrive/c/Windows/system32/wscript.exe 

CYGWIN environment variable option"nodosfilewarning"turns off 
this warning. 

Consult the user's guide for more details about POSIX paths: 

http://cygwin.com/cygwin-ug-net/using.html#using-pathnames 

(cd./jdk/make&&\ 

ea 因 篇 幅 关 系 ， 中 间 省 略 了 大 量 的 输出 内 容 .…. 

OpenJDK-specific settings: 

FREETYPE_HEADERS_PATH=D:/jdkBuild/freetype-2.3.5-1-bin/include 

ALT_FREETYPE_HEADERS_PATH=D:/jdkBuild/freetype-2.3.5-1- 
bin/include 

FREETYPE_LIB_PATH=D:/jdkBuild/freetype-2.3.5-1-bin/bin 

ALT_FREETYPE_LIB_ PATH=D:/jdkBuild/freetype-2.3.5-1-bin/bin 

OPENJDK Import Binary Plug Settings: 

IMPORT_BINARY_PLUGS=true 

BINARY_PLUGS_JARFILE=D:/jdkBuild/jdk7plug/openjdk-binary- 
plugs/jre/lib/rt-closed.jar 

ALT_BINARY_PLUGS_JARFILE= 

BINARY_PLUGS_PATH=D:/jdkBuild/jdk7plug/openjdk-binary-plugs 

ALT_BINARY_PLUGS_PATH=D:/jdkBuild/jdk7plug/openjdk-binary-plugs 

BUILD_BINARY_PLUGS_PATH=J:/re/jdk/1.7.0/promoted/latest/openjdk/ 
binaryplugs 

ALT_BUILD_BINARY_PLUGS_PATH= 

PLUG_LIBRARY_NAMES= 

Previous JDK Settings: 

PREVIOUS_RELEASE_PATH=USING-PREVIOUS_RELEASE_IMAGE 

ALT_PREVIOUS_RELEASE_PATH= 

PREVIOUS_JDK_VERSION=1.6.0 

ALT_PREVIOUS_JDK_VERSION= 

PREVIOUS_JDK_FILE= 

ALT_PREVIOUS_JDK_FILE= 

PREVIOUS_JRE_FILE= 

ALT_PREVIOUS_JRE_FILE= 


PREVIOUS_RELEASE_IMAGE=D:/_ DevSpace/JDK 1.6.0 21 
ALT_PREVIOUS_RELEASE_IMAGE= 
Sanity check passed. 


Makefile 的 Sanity 检 查 过 程 输出 了 编译 所 需 的 所 有 环境 变量 ， 如 果 
看 到 "Sanity check passed."， 说 明 检 查 过 程 通 过 了 ， 可 以 输入 "make" 执 
行 整个 Makefile， 笔 者 使 用 Core i5/4GB RAM 的 机 器 编译 整个 JDK 大 概 
需要 半 个 多 小 时 。 如 果 失 败 则 需要 根据 系统 输出 的 失败 原因 ， 回 头 再 
仿 查 一 下 对 应 的 设置 。 并 且 最 好 在 下 一 次 编译 之 前 先 执行 "make 
clean" 来 请 理 挤 上 次 编译 遗留 的 文件 。 


编译 完成 之 后 ， 打 开 OpenJDK 源 码 下 的 build 目 孙 ， 看 看 是 不 是 已 
经 有 一 个 编译 好 的 JDK 在 那里 等 着 了 ? 执行 一 下 "java-version"， 看 到 
以 自己 机 器 命名 的 JDK 了 吧 ， 很 有 成 就 感 吧 ! 


附录 B 


字 节 码 
0x00 
0x01 
0x02 
0x03 
0x04 
Ox05 
0x06 
0x07 
0x08 
0x09 
0x0a 
0x0b 
0x0c 
0x0d 
0x0e 
OxOf 
0x10 
Ox1l 
0x12 
0x13 
0x14 
Ox15 
0x16 
0x17 
Ox18 
Ox19 
Oxla 
Oxlb 
Oxlc 
Oxld 
Oxle 
Ox1f 


虚拟 机 子 市 码 指令 表 


助 记 


aconst_null 
iconst_ ml 
iconst 0 
iconst 1 
iconst 2 
iconst 3 
iconst 4 
iconst_S 
lconst 0 
lconst_1 
fconst 0 
fconst 1 


fconst 2 


dconst_1 


bipush 


sipush 
lde 
ldc_w 
ldc2 w 
iload 
lload 


iload 1 
iload 2 
iload 3 
lload 0 
lload 1 


指令 含义 
什么 都 不 做 
将 null 推送 至 栈 顶 
将 int 型 -1 推送 至 栈 顶 
将 int 型 0 排 送 至 栈 顶 
将 int 型 1 推送 至 栈 顶 
将 int 型 2 推送 至 栈 顶 
将 int 型 3 推送 至 栈 顶 
将 int 型 4 推送 至 栈 顶 
将 int 型 5 推送 至 栈 顶 
将 long 型 0 推送 至 栈 顶 
将 long 型 1 推送 至 栈 顶 
将 float 型 0 排 送 至 栈 顶 
将 foat 型 1 推送 至 栈 顶 
将 float 型 2 推送 至 栈 顶 
将 double 型 0 排 送 至 栈 项 
将 double 型 1 推送 至 栈 顶 
将 单字 节 的 常量 值 (-128~127) 推送 至 栈 顶 
将 一 个 短 整 型 常量 值 (-32768~32767) 推送 至 栈 顶 
将 int、float 或 String 型 常量 值 从 常量 池 中 推送 至 栈 顶 


将 int、float 或 String 型 常量 值 从 常量 池 中 推送 至 栈 顶 【 宽 索 引 ) 


将 long 或 double 型 常量 值 从 常量 池 中 推送 至 栈 顶 《〈 宽 索引 》 
将 指定 的 int 型 本 地 变量 推送 至 栈 顶 
将 指定 的 long 型 本 地 变量 推送 至 栈 顶 
将 指定 的 float 型 本 地 变量 推送 至 栈 顶 
将 指定 的 double 型 本 地 变量 推送 至 栈 顶 
将 指定 的 引用 类 型 本 地 变量 推送 至 栈 顶 
将 第 一 个 int 型 本 地 变量 推送 至 栈 顶 
将 第 二 个 int 型 本 地 变量 推送 至 栈 项 
将 第 三 个 int 型 本 地 变量 推送 至 栈 项 
将 第 四 个 int 型 本 地 变量 推送 至 栈 项 
将 第 一 个 long 型 本 地 变 基 推送 至 栈 顶 
将 第 二 个 long 型 本 地 变量 推送 至 栈 顶 


lload 2 


fivad 0 
fload 1 
fload 2 
fioad 3 
dload 0 
dload 1 
dload 2 
dload 3 
aload 0 
aload | 
aload 2 
aload 3 
iaload 
laload 
faload 
daload 
anload 
baload 
caload 
saload 


至 
a 


Istore 


加 
3 


istore 2 
istore 3 


lstore 1 
Jstore 2 
lstore 3 


fstore 0 
fstore_1 


指令 含义 

将 第 三 个 long 型 本 地 变 基 推送 至 栈 项 
将 第 四 个 long 型 本 地 变 基 排 送 至 栈 顶 
将 第 一 个 foat 型 本 地 变 握 排 送 至 栈 蔗 
将 第 二 个 float 型 本 地 变量 排 送 至 栈 弄 
将 第 三 个 float 型 本 地 变 世 推送 至 栈 顶 
将 第 四 个 float 者 本 地 变量 推送 至 栈 硕 
将 第 一 个 double 型 本 地 变量 排 送 至 栈 项 
将 第 二 个 double 型 本 地 变量 推送 至 息 项 
将 第 三 个 double 型 本 地 变量 推送 至 栈 顶 
将 第 外 个 double 型 本 地 变 基 推送 至 栈 磺 
将 第 一 个 引用 类 型 本 地 变 基 推送 至 栈 顶 
将 第 二 个 引用 类 型 本 地 变量 推送 至 栈 硕 
将 第 三 个 引用 类 型 林地 变量 推送 至 栈 顶 
将 第 四 个 引用 类 型 本 地 变量 蕉 送 至 栈 项 
将 int 型 数组 指定 索引 的 值 推送 至 栈 顶 
将 long 型 数组 指定 索引 的 值 推送 至 栈 顶 
将 float 型 数组 指定 索引 的 值 排 适 至 栈 更 
将 double 型 数组 指定 索引 的 值 排 送 至 栈 项 
将 引用 型 数组 指定 索引 的 值 推送 至 栈 顶 


将 boolean 或 byte 型 数组 指定 索引 的 值 排 送 至 栈 质 


将 char 型 数组 指定 索引 的 值 推送 至 栈 顶 
将 short 描 数 组 指定 索引 的 值 推 送 译 栈 顶 
将 栈 项 int 型 数值 存 人 指定 本 地 变 基 

将 栈 项 long 型 数值 存 人 指定 本 地 变量 
将 栈 顶 float 型 数值 存 人 指定 本 地 变 插 
将 栈 顶 double 型 数值 存 人 指定 本 地 变 基 
将 栈 现 引用 型 数 俊 存 和 指定 本 地 变 其 
将 栈 硕 int 型 数值 存 人 第 一 个 本 地 变量 
将 栈 顶 int 型 数值 存 和 人 第 二 个 本 地 变 其 
将 栈 顶 int 型 数值 存 人 第 三 个 本 地 变量 
将 栈 顶 int 型 数值 存 人 第 四 个 本 地 变 其 
将 栈 顶 long 型 数值 在 人 第 一 个 本 地 变量 
将 栈 顶 long 型 数值 在 人 第 二 个 本 地 变量 
将 栈 顶 long 型 敌 值 在 人 第 三 个 本 地 变量 
将 栈 项 long 型 致 值 在 入 第 四 个 本 地 变 基 
将 栈 顶 foat 型 数值 在 人 第 一 个 本 地 变量 
将 栈 项 filoat 型 数值 存 人 第 二 个 本 地 变 基 
将 栈 项 float 型 数值 在 人 第 三 个 本 地 变量 


( 续 ) 


指令 信 

将 我 项 float 型 数值 在 人 第 四 个 本 地 变量 

将 栈 顶 double 型 数值 存 人 第 一 个 本 地 变节 

| astore 1 | 将 栈 顶 double 型 数值 存 人 第 二 个 本 地 变量 

| dstore 2 。 ”| 将 栈 项 double 型 数值 存 人 第 三 个 本 地 变量 

将 栈 顶 double 型 数值 存 人 第 四 个 本 地 变 基 

将 栈 顶 引用 型 数值 存 人 第 一 个 本 地 变 基 

| astore_1 | 将 乒 项 引用 型 数值 存 入 第 二 个 本 地 变节 

将 栈 顶 引用 型 数值 存 人 第 三 个 本 地 变量 

| astore 3 | 将 栈 项 引用 型 数值 存 和 人 第 四 个 本 地 变 估 

| iastore 。 ”| 将 栈 项 int 型 数值 存 人 指定 数组 的 指定 索引 位 置 

| lastore | 将 栈 项 long 型 数值 存 和 人 指定 数组 的 指定 索引 位 办 

| fastore 。 | 将 栈 顶 fiont 坦 数 值 在 人 指定 数组 的 指定 索引 位 辕 

将 乒 顶 double 型 数值 存 人 指定 数组 的 指定 索引 位 置 

将 秘 顶 引用 型 数值 存 入 指定 数组 的 指定 案 引 位 轩 

将 栈 顶 boolean 或 byte 型 数值 存 人 指定 数组 的 指定 索引 位 总 
| sastore | 将 栈 项 char 型 数值 存 人 指定 数组 的 指定 索引 位 转 
将 栈 顶 short 型 数值 存 和 指定 数组 的 指定 索引 位 置 

| pop | 将 栈 项 数值 弹出 (数值 不 能 是 Iong 或 double 类 型 的 ) ) 


将 栈 项 的 一 个 【对 于 long 或 double 类 型 ) 或 两 个 数值 “对 于 非 long 或 double 
的 其 他 类 型 ) 弹出 
复制 栈 顶 数值 并 将 复制 值 压 入 栈 顶 
复制 栈 顶 数值 并 将 两 个 复制 值 压 人 栈 项 
dup_x2 复制 乒 项 数值 并 将 三 个 〈 或 两 个 ) 复制 值 奈 入 栈 顶 
复制 栈 顶 一 个 (对 于 long 或 double 类型) 或 两 个 “对 于 非 long 或 double 的 其 
他 类 型 ) 数值 并 将 复制 值 奈 人 柜 项 
dup_xl 指令 的 双 信 版 本 
dup_x2 指令 的 双 信 版 本 
将 栈 最 项 凋 的 两 个 数值 互 换 (数值 不 能 是 long 或 double 类 型 ) 
将 栈 顶 两 int 型 数值 相 加 并 将 结果 床 人 栈 项 
将 栈 顶 两 long 型 数 值 相 加 并 将 结果 故人 人 栈 顶 
fadd 将 乒 顶 两 float 型 数值 相 加 并 将 结果 压 人 和 栈 顶 
将 栈 项 两 double 型 数值 相 加 并 将 结果 压 入 栈 顶 
将 栈 顶 两 int 型 数值 相 减 并 将 结果 压 人 栈 顶 
将 栈 顶 两 long 型 数值 相 减 并 将 结果 压 人 栈 项 
fsub 将 栈 现 两 float 型 数值 相 减 并 将 结果 讨 人 栈 顶 
将 找 珊 两 double 型 数值 相 减 并 将 结果 讨 人 栈 隅 
将 乒 项 两 int 型 数值 相 乘 并 将 禁果 压 人 栈 项 
将 栈 项 两 long 型 数值 相 乘 并 将 结业 压 入 栈 顶 


号 
尼 


助 记 符 


idiv 


fdiv 


fre 


ineg 


司 
5 


e 


Ee 


E 


党 2 
和 tt 


lushr 


B| 沪 
全 


4 


指令 含义 
将 栈 顶 两 float 型 数值 相 潜 并 将 结果 压 入 栈 现 
将 栈 顶 丙 double 型 数值 相 乘 并 将 结果 压 人 栈 顶 
将 栈 顶 两 int 型 数值 相 除 并 将 缚 果 压 人 材 陋 
将 栈 预 两 long 型 数值 相 除 并 将 结果 奈 入 栈 珊 
将 栈 巴 两 float 型 数值 相 除 并 将 结果 压 人 栈 碧 
将 栈 顶 两 double 型 数值 相 除 并 将 结 末 压 入 栈 顶 
将 栈 预 两 int 型 数值 作 取 黎 运 算 并 将 结果 奈 人 栈 顶 
将 栈 预 两 long 型 数值 作 取 模 运算 并 将 结果 床 人 栈 顶 
将 栈 顶 两 float 型 数值 作 取 械 返 算 并 将 结果 斥 入 栈 顶 
将 栈 顶 两 double 型 数值 作 取 模 运 算 并 将 外 时 压 入 乒 顶 
将 栈 顶 int 型 数值 到 负 并 将 结果 压 人 栈 项 
将 栈 顶 long 型 数值 取 负 和 并 将 结果 压 人 栈 顶 
将 栈 顶 float 型 数值 取 负 并 将 结果 压 人 栈 顶 
将 牧 项 double 型 数值 吏 负 并 将 结果 压 人 栈 顶 
将 int 型 数值 左 移 位 指定 位 数 并 将 关 当 压 人 栈 顶 
将 long 型 数值 堪 移 位 指定 位 数 孝 将 结果 于 人 要 顶 
将 int 型 数值 右 〈 带 符号 ) 移 位 指定 位 数 并 将 结果 压 人 栈 于 
将 long 型 数值 右 〔 带 符号 ) 移 位 指定 位 数 并 将 结果 压 人 栈 了 项 
将 int 型 数值 右 (无 符号 ) 移 位 指定 位 数 并 将 结果 压 人 栈 顶 
将 long 型 数值 右 ' 无 符号 ) 移 位 指定 位 数 并 将 结果 压 人 栈 顶 
糙 栈 项 两 int 型 数值 作 “ 按 位 与 ”并 将 结果 讨 人 栈 项 
将 栈 顶 两 long 型 数值 作 “ 按 位 与 ”和 并 将 结果 压 人 栈 顶 
将 栈 顶 两 int 型 数值 作 “ 按 位 或 ”并 将 结果 奈 人 栈 顶 
将 栈 项 两 long 型 数值 作 “ 按 位 或 ”六 将 结果 压 人 栈 预 
将 栈 顶 两 int 型 数值 作 “ 按 位 异 或 ”并 将 结果 压 人 栈 顶 
将 栈 顶 两 long 型 数值 作 “ 按 位 异 或 ”并 将 结果 压 人 栈 顶 
将 指定 int 型 变量 增加 指定 众 ( 如 计 +、i--、 计 =2 等 ) 
将 栈 顶 int 规 数 值 强制 转换 成 long 型 数值 并 将 结果 压 人 栈 顶 
将 栈 顶 int 型 数值 强制 转换 成 Boat 型 数值 并 将 结果 压 人 栈 项 
将 栈 顶 int 型 数值 强制 转换 成 doubie 弄 数 值 并 将 结果 压 人 栈 巴 
将 栈 顶 long 型 数值 强制 转 搞 成 int 型 数值 并 将 结果 压 人 栈 顶 
将 窗 硕 long 而 数值 强制 转换 成 foat 型 数值 并 将 结果 压 入 栈 顶 
将 栈 顶 long 型 数值 强制 转换 成 double 型 数值 并 将 结果 压 人 栈 于 
将 栈 顶 float 地 数值 强制 转 搞 成 int 型 数值 并 将 结果 压 人 栈 殴 
将 栈 顶 foat 型 数值 强制 转换 成 Iong 型 数值 并 将 结果 压 入 栈 顶 
将 栈 顶 float 型 数值 强制 转换 成 double 型 数值 并 将 结果 压 人 栈 顶 
将 栈 顶 double 雹 数值 强制 转换 成 int 型 致 值 并 将 站 昌 压 人 拷 项 
将 模 顶 double 型 数值 强制 转换 成 long 弄 数 值 并 将 绪 果 压 人 栈 顶 


( 续 ) 


如 


记 
da2f 


[3 
宁 


fcmpl 


dempg 


ifge 
ifgt 


if_icmped 
if_ icmpne 
if icmplt 
让 这 mpge 
if_ icmpP&t 
if_ icmple 
if acmpedq 


if acmpne 


i 
3 


三 沪 | 已 
5S 


加 
E 


指令 含义 
将 秘 顶 double 型 数值 强制 转换 成 hoat 型 数值 并 将 结果 压 入 栈 顶 
将 栈 顶 int 型 数值 强制 转换 成 byte 型 数值 并 将 结果 压 入 栈 顶 
将 秘 顶 int 型 数值 强制 转换 成 char 型 数值 并 将 结果 奈 入 栈 顶 
将 栈 顶 int 型 数值 强制 转换 成 short 型 数值 并 将 结果 压 人 栈 顶 
比较 栈 顶 两 long 型 数值 的 大 小 ， 关 将 结果 (1、0 或 -1) 压 入 栈 顶 
比较 校 项 两 float 型 数值 的 大 小 ， 并 将 结 泉 51、0 或 -1) 在 人 栈 项 ; 当 其 中 一 


个 数值 为 “NaN” 时 ， 将 -1 和 压 人 栈 碧 


比较 栈 项 两 Boat 型 数值 的 大 小 ， 并 将 结果 (1、0 或 -1) 故人 栈 顶 ; 当 其 中 一 


个 数值 为 “NaN” 时 ,将 1 讨 人 栈 孤 


比较 栈 顶 两 double 型 数值 的 大 小 ， 并 将 结果 (1、0 或 -1) 压 人 栈 顶 ; 当 其 中 
一 个 数值 为 “NaN” 圭 ， 将 -1 压 人 栈 佐 

比较 栈 顶 两 double 型 数值 的 大 小 ， 并 将 结果 (1、0 或 =1) 压 人 栈 项: 当 其 中 
一 个 数值 为 “NaN” 时 ， 将 1 压 人 栈 顶 

当 栈 项 int 型 数值 等 于 0 时 由 转 

当 栈 项 int 型 数值 不 等 于 0 时 跳 园 

当 栈 项 int 型 数值 小 于 0 时 跳 转 

当 栈 顶 int 型 数值 大 于 或 等 于 0 时 跌 转 

当 栈 顶 int 型 数值 大 于 0 时 跳 转 

当 秘 顶 int 型 数值 小 于 或 等 于 0 时 跳 转 

比较 栈 弄 两 int 型 数值 的 大 小 ， 当 结果 等 于 0 时 跳 转 

比较 栈 项 两 int 型 数值 的 大 小 ， 当 结果 不 等 于 0 时 跳 转 

比较 栈 项 两 int 型 数值 的 大 小 ， 当 结果 小 于 0 时 跳 转 

比较 栈 顶 两 int 型 数值 的 大 小 ， 当 结果 大 于 或 等 于 0 时 跳 转 

比较 栈 项 两 int 型 数值 的 大 小 ， 当 结果 大 于 0 时 跳 转 

比较 栈 项 两 int 型 数 值 的 大 小 ， 当 结果 小 于 或 等 于 0 时 跳 转 

比较 栈 项 两 引用 者 数值 ， 当 结 染 相等 时 跳 转 

比较 栈 项 两 引用 型 数值 ， 当 关 虽 不 相等 时 中转 

无 条 件 跳 转 

跳 转 至 指定 的 16 位 oftset 位 置 ， 并 将 jsr 的 下 一 条 指令 地 址 压 人 栈 顶 

返回 至 本 地 变量 指定 的 index 的 指令 位 贰 一般 与 jsr 或 jsr w 泌 合 使 用 ) 

用 于 switeh 条 件 跳 转 ，case 值 连续 〈 可 变 长 度 指令 ) 

用 于 switch 条 件 跳 转 ，case 值 不 连 绪 (可 变 长 度 指 令 ) 

从 当 藤 方法 返回 int 

从 当前 方法 返回 long 

从 当前 方法 返回 float 

从 当前 方法 返回 double 

从 当前 方法 返回 对 象 引用 

从 当前 方法 返回 void 

获 到 指定 类 的 静态 域 ， 措 将 其 值 诗人 栈 顶 


字 节 码 指令 含义 
Oxb3 为 指定 的 类 的 静态 域 赋值 
Oxb4 获取 指定 类 的 实例 域 ， 并 将 其 值 压 人 栈 项 
0xb5 | putield | 为 指定 的 类 的 实例 域 赋值 
Oxb6 调用 实例 方法 
Oxb7 调用 超 类 构造 方法 ， 实 例 初始 化 方法 ， 私 有 方法 
Oxb8 调用 静态 方法 
Oxb9 调用 接口 方法 
Oxba 调用 动态 方法 
0xbb new 创建 一 个 对 象 ， 并 将 其 引用 值 压 入 栈 顶 

创建 一 个 指定 的 原始 类 型 (如 int、float、char 等 ) 的 数组 ， 并 将 其 引用 值 压 入 
0xbc newarray g 

栈 顶 
Oxbd 创建 一 个 引用 型 (如 类 、 接 口 、 数 组 ) 的 数组 ， 并 将 其 引用 值 压 人 栈 项 
Oxbe 获得 数组 的 长 度 值 并 压 人 栈 顶 
Oxbf 将 栈 顶 的 异常 抛 出 
Oxc0 检验 类 型 转换 ， 检 验 未 通过 将 抛 出 ClassCastException 
Oxcl 检验 对 象 是 否 是 指定 的 类 的 实例 ， 如 果 是 ， 则 将 ! 压 人 栈 顶 ， 否 则 将 0 压 人 栈 顶 
Oxc2 获得 对 象 的 锁 ， 用 于 同步 方法 或 同步 志 
0xc3 释放 对 象 的 锁 ， 用 于 同步 方法 或 同步 块 
0xc4 | wide ”| 扩展 本 地 变量 的 宽度 
Oxcs 。 | multianewarray | 创建 指定 类 型 和 指定 维度 的 多 维 数组 (执行 该 指令 时 ， 操 作 酰 中 必须 包含 各 维 
度 的 长 度 值 )， 并 将 其 引用 值 压 和 人 栈 顶 

Oxc6 为 null 时 跳 转 
0xc7 不 为 null 时 跳 转 
Oxc8 无 条 件 跳 转 ( 宽 索引 ) 
Oxc9 跳 转 至 指定 的 32 位 offset 位 置 ， 并 将 jsr_w 的 下 一 条 指令 地 址 压 入 栈 顶 


附录 C ” HotSpot 虚拟 机 主要 参数 表 


本 参数 表 以 JDK 1.6 为 基础 编写 ，JDK 1.6 的 HotSpot 虚 拟 机 有 很 多 
非 稳定 参数 (Unstable Options， 即 以 -XX: 开 头 的 参数 ，JDK 1.6 的 虚拟 
机 中 大 概 有 660 多 个 ) ， 使 用 -XX:+PrintFlagsFinal 参 数 可 以 输出 所 有 参 
数 的 名 称 及 默认 值 (默认 不 包括 Diagnostic 和 Experimental 的 参数 ， 如 果 
需要 ， 可 以 配合 -XX:+UnlockDiagnosticVMOptions/- 
XX:+UnlockExperimentalVMOptions 一 起 使 用 ) ， 下 面 的 各 个 表格 只 包 
含 了 其 中 最 常用 的 (或 在 本 书 中 介绍 到 的 ) 部 分 。 参 数 使 用 的 方式 有 
如 下 3 种 : 


-XX:+ < 之 option> 开局 option 参 数 。 
-XX:-<<option> 天 闭 option 参 数 。 


-XX:<option>=<value> 将 option 参 数 的 值 设置 为 value 。 


C.1 内 存 管理 参数 


参数 使 用 介绍 


DisableExplicitGC 默认 关闭 忽略 来 自 System.gc(0) 方法 触发 的 垃圾 收集 


ExplicitGCInvokes 默认 关闭 当 收 到 System.gc(0) 方法 提交 的 垃圾 收集 申请 时 ， 
Concurrent 使 用 CMS 收集 融 进 行 收集 


虚拟 机 运行 在 Client 模式 下 的 默认 值 ， 打 开 此 开 


其 他 模式 关闭 使 用 Serial+Serial Old 的 收集 器 组 合 进行 内 存 


er 打开 此 开关 后 ， 使 用 ParNew+Serial Old 的 收集 器 
UseParNewGC 认 关 
Ser arINeW 默认 关闭 组 合 进行 内 存 回 收 


打开 此 开关 后 ， 使 用 ParNew+CMS+Serial Old 的 
收集 器 组 合 进行 内 存 回收 。 如 果 CMS 收集 器 出 现 
Concurrent Mode Failure， 则 Serial Old 收集 器 将 作 
为 后 备 收集 带 

虚拟 机 运行 在 Server 模式 下 的 默认 值 ， 打 开 此 开 
关 后 ， 使 用 Parallel Scavenge+Serial Old 的 收集 器 组 
合 进行 内 存 回收 


Client 模式 的 虚拟 机 默认 开启 ， 


UseSerialGC 


UseConcMarkSweepGC 


Server 模 式 的 虚拟 机 默认 开 
启 ， 其 他 模式 关闭 


UseParallelGC 


( 续 ) 


Ed ne 使 用 介绍 
打开 此 开关 后 ， 使 用 Parallel Scavenge + Parallel 
Old 的 收集 器 组 合 进行 内 存 回 收 


SurvivorRatio 新 生 代 中 Eden 区 域 与 Survivor 区 域 的 容量 比值 


| 直接 普 升 到 老年 代 的 对 象 大 小 ， 设 置 这 个 参数 后 ， 
EA i 大 于 这 个 参数 的 对 象 将 直接 在 老年 代 分 配 


晋升 到 老年 代 的 对 象 年 龄 ， 每 个 对 象 在 坚持 过 一 
MaxTenuringThreshold 默认 值 为 15 次 Minor GC 之 后 ， 年 零 就 增加 1， 当 超过 这 个 参数 
值 时 就 进入 老年 代 

动态 调整 Java 堆 中 各 个 区 域 的 大 小 及 进入 老年 代 
的 年 龄 

是 否 人 允许 分 配 担保 失败 ， 即 老年 代 的 剩余 空间 不 
足以 应 付 新 生 代 的 整个 Eden 和 Survivor 区 的 所 有 对 
象 都 存活 的 极端 情况 


UseParallelOldGC 默认 关闭 


UseAdaptiveSizePolicy 默认 开启 


JDK 1.5 及 以 前 版 本 默认 关闭 ， 
JDK 1.6 默认 开启 


HandlePromotionFailure 


少 于 或 等 于 8 个 CPU 时 默认 


ParallelGCThreads 值 为 CPU 数量 值 ， 多 于 8 个 时 | 设置 并 行 GC 时 进行 内 存 回 收 的 线程 数 
比 CPU 数量 值 小 


SS a GC 时 间 占 总 时 间 的 比率 ， 上 默认 值 为 9， 即 允许 1% 

imeRatio WEA 的 GC 时 间 。 仅 在 使 用 Parallel Scavenge 收集 器 时 生效 

WE BS 设置 GC 的 最 大 停顿 时 间 。 仅 在 使 用 Parallel Scavenge 
MaxGCPauseMillis 无 默认 值 收集 器 时 生效 


CMSInitiatingOccupancy 设置 CMS 收集 器 在 老年 代 空 间 被 使 用 多 少 后 触发 
Fraction 垃圾 收集 ， 仅 在 使 用 CMS 收集 器 时 生效 
UseCMSCompactAtFull 设置 CMS 收集 器 在 完成 垃圾 收集 后 是 否 要 进行 一 
Collection 次 内 存 碎 片 整理 。 仅 在 使 用 CMS 收集 器 时 生效 


CMSFullGCsBefore 无 路 认 什 设置 CMS 收集 器 在 进行 若干 次 垃圾 收集 后 再 启动 
Compaction -次 内 存 碎片 整理 。 仅 在 使 用 CMS 收集 器 时 生效 


ScavengeBeforeFullGC 默认 开启 在 Full GC 发 生 之 前 触发 一 次 Minor GC 
禁止 GC 过程 无 限制 地 执行 ， 如 果 过 于 频繁 ， 就 直 
接 发 生 OutOfMemory 异常 


优先 在 林地 线程 缓冲 区 中 分 配对 象 ， 各 免 分 配 内 
UseTLAB S 本 人 
se erver 模式 默认 开启 存 时 的 锁定 过 程 
当 Xmx 值 比 Xms 值 大 时 ， 堆 可 以 动态 收缩 和 扩 
i 
i 陵 认 值 为 7 展 ， 这 个 参数 控制 当 堆 空 闲 大 于 指定 比率 时 自动 收纳 


当 Xmx 值 比 Xms 值 大 时 ， 堆 可 以 动态 收缩 和 扩 


MinHeapFreeRati S 为 40 
ER Ee 展 ， 这 个 参数 控制 当 堆 空 亲 小 于 指定 比率 时 自动 扩展 


[时 局 
MaxPermSize 大 部 分 情况 下 默认 值 是 64MB 永久 代 的 最 大 值 


UseGCOverheadLimit 默认 开启 


C.2 ”即时 编译 参数 


参数 使 用 介绍 
CompileThreshold peg 触发 方法 即时 编译 的 阔 值 


模式 下 是 10000 

OSR 比率 ， 它 是 OSR 即时 编译 阔 值 计算 公 
式 的 一 个 参数 ， 用 于 代替 BackEdgeThreshold 
参数 控制 回 边 计数 天 的 实际 溢出 阔 值 


Client 模式 下 默认 值 是 933，Server 
模式 下 是 140 


ReservedCodeCacheSize 大 部 分 情况 下 默认 值 是 32MB 即时 编译 器 编译 的 代码 缓存 的 最 大 值 


OnStackReplacePercentage 


C.3 ”类 型 加 载 参 数 


sm EEE 


使 用 依赖 StackMapTable 信息 的 类 型 检查 代替 数据 流 分 析 ， 以 加 


UseSplitVerifier 默认 开启 快 字 节 码 校 验 速度 
当 类 型 校 验 失败 时 ， 是 否 人 允许 回 到 老 的 类 纪 : 导 校 联 讲 行 校 
a 默认 开启 当 类 型 校 验 失败 时 ， 是 否 允许 回 到 老 的 类 型 推导 校 验 方式 进行 校 


验 ， 如 果 开 启 则 允许 
RelaxAccessControlCheck 默认 关闭 在 校 验 阶段 放松 对 类 型 访问 性 的 限制 


C.4 多 线程 相关 参数 


Cm CT 
UseSpinning JDK 1.6 默认 开启 ，JDK 1.5 默认 关闭 | ”开启 自 旋 锁 以 避免 线程 频繁 挂 起 和 唤醒 
PreBlockSpin 使 用 自 旋 锁 时 默认 的 自 旋 次 数 
UseThreadPriorities 使 用 本 地 线程 优先 级 
UseBiasedLocking 是 否 使 用 偏向 锁 ， 如 果 开 启 则 使 用 

攻 =| 


当 频 繁 反 射 执 行 革 不 方法 时 ’ 生成 写 季 码 
S A Cess S 
UseFastAccessorMethods | ”默认 开启 来 加 快 反射 的 执行 速度 


参数 使 用 介绍 
使 用 激进 的 优化 特性 ， 这 些 特 性 一 般 是 具备 
AggressiveOpts JDK 1.6 默认 开启 ，JDK 1.5 默认 关闭 | 正面 和 负面 双重 影响 的 ， 需 要 根据 具体 应 用 特 


点 分 析 才 能 判定 是 否 对 性 能 有 好 处 


a 如 果 可 能 ， 使 用 大 内 存 分 页 ， 这 项 特性 需要 
UseLargePages 默认 开启 操作 系统 的 支持 


Sm EEE 


使 用 指定 大 小 的 内 存 分 页 ， 这 项 特性 需要 操 


StringCache 默认 开启 是 否 使 用 字符 串 缓存 ， 开 启 则 使 用 


参数 


HeapDumpOnOutOf MemoryError 


OnOutOfMemoryError 


OnError 
PrintClassHistogram 


PrintConcurrentLocks 
PrintCommandLineFlags 
PrintCompilation 
PrintGC 

PrintGCDetails 
PrintGCTimeStamps 
PrintTenuringDistribution 
TraceClassLoading 
TraceClassUnloading 


PrintInlining 


PrintCFGToFile 


PrintldealGraphFile 


UnlockDiagnosticVM Options 


PrintAssembly 


默认 值 使 用 介绍 

默认 关闭 在 发 生 内 存 溢出 异常 时 是 否 生成 堆 转 储 快照 ， 关 闭 则 不 生成 
无 默认 值 当 虚 拟 机 抛 出 内 存 溢出 异常 时 ， 执 行 指定 的 命令 

无 默认 值 当 虚 拟 机 抛 出 ERROR 异常 时 ， 执 行 指定 的 命令 

使 用 [ctr]]-[break] 快捷 键 输出 类 统计 状态 ， 相 当 于 jmap-histo 
的 功能 

默认 关闭 打印 JU.C 中 锁 的 状态 

默认 关闭 打印 启动 虚拟 机 时 输入 的 非 稳定 参数 

默认 关闭 打印 方法 即时 编译 信息 

默认 关闭 打印 GC 信息 

默认 关闭 打印 GC 的 详细 信息 

默认 关闭 打印 GC 停顿 耗 时 

默认 关闭 打印 GC 后 新 生 代 各 个 年 龄 对 象 的 大 小 

默认 关闭 打印 类 加 载 信息 

默认 关闭 打印 类 印 载 信息 

默认 关闭 打印 方法 的 内 联 信息 

将 CFG 图 信息 输出 到 文件 ， 只 有 DEBUG 版 虚拟 机 才 支 持 此 


默认 关闭 


默认 关闭 参数 
不 四 信息 输出 到 文件 ， 只 有 了 版 虚 扫 “ 支 扣 
默认 关闭 bs Ideal 图 信息 输出 到 文件 有 DEBUG 版 虚拟 机 才 支 持 此 


让 虚拟 机 进入 诊断 模式 ， 一 些 参 数 (如 PrintAssembly) 需要 
在 诊断 模式 中 才能 使 用 
默认 关闭 打印 即时 编译 后 的 二 进 制 信息 


默认 关闭 


附录 D 对象 查询 语言 (OQL) 简介 


D.1 SELECT 子 句 


SELECT 了 于 句 用 于 确定 查询 语句 需要 从 堆 较 储 快照 中 选择 什么 内 
容 。 如 果 需 要 显示 堆 转 储 快 照 中 的 对 象 ， 并 且 浏 贤 这 些 对 象 的 引用 关 
系 ， 可 以 使 用 “*"， 这 与 传统 SQL 语句 中 的 习惯 是 一 致 的 ， 如 : 


SELECT * FROM java.lang.String 


1. 选 择 特定 的 显示 列 


查询 也 可 以 选择 特定 的 需要 显示 的 字段 ， 如 : 


SELECT toString (s) , s.count,s.value FROM java.lang.String s 


查询 可 以 用 “@” 符 号 来 使 用 Java 对 象 的 内 存 属 性 访问 器 。MAT 提 
供 了 一 系列 的 内 置 画 数 来 获取 与 分 析 相 关 的 信息 ， 如 : 


SELECT toString (s) , s.@usedHeapSize,s.@retainedHeapSize FROM 
jJava.lang.String s 


关于 对 和 象 属性 访问 右 的 具体 内 容 ， 可 以 参见 下 文 的 “属性 访问 


2. 使 用 列 别名 
可 以 使 用 AS 关键 字 来 对 选择 的 列 进行 命名 ， 如 : 


SELECT toString (s) AS Value， 
Ss.Q@usedHeapSize AS"Shallow Size", 
s.Q@retainedHeapSize AS"Retained Size" 
FROM java.lang.String s 


可 以 使 用 "AS RETAINED SET'" 关 键 字 来 获得 与 选择 对 象 相 关联 的 
对 象 集合 ， 如 ;: 


SELECT AS RETAINED SET * FROM java.lang.String 
3. 拼 合成 为 一 个 对 象 列表 选择 项 目 


可 以 使 用 "OBJECTS" 关 键 字 把 SELECT 子 句 中 查找 出 来 的 数据 项 
目 转变 为 对 象 ， 如 : 


SELECT OBJECTS dominators (s) FROM java.lang.String s 


上 面 例子 中 ， 函 数 "dominators0" 将 会 返回 一 个 对 象 数组 ， 因 此 ， 
如 果 没 有 "OBJECTS" 关 键 字 ， 上 面 的 查询 将 返回 一 组 二 维 的 对 象 数组 
的 列表 。 通 过 使 用 关键 字 "OBJECTS"， 我 们 迫使 OQL 把 查询 结果 缩减 
为 一 维 的 对 象 列表 。 


4. 排 除 重复 对 和 象 


使 用 "DISTINCT" 关 键 字 可 以 排除 结果 集中 的 重复 对 象 ， 如 : 


SELECT DISTINCT classof (s) FROM java.lang.String s 


上 面 的 例子 中 ， 画 数 "classof0" 的 作用 是 返回 对 象 所 属 的 Java 类 ， 
当然 ， 所 有 子 符 串 对 和 象 的 所 属 类 都 古 java.lang.String， 因 此 ， 如 果 上 面 
的 查询 中 没有 加 入 DISTINCT 关 键 字 ， 查 询 结 果 就 会 返回 与 快照 中 的 
字符 串 数 量 一 样 多 的 行 记录 ， 并 且 每 行 记录 的 内 容 都 是 java.lang.String 


[1 本 附录 翻译 自 Edlipse Memory Analyzer Tool (MATEclipse 出 品 的 内 
存 分 析 工 具 ) 的 OQL 帮 助 文档 。 


D.2 FROM 子 句 


1.FROM 子 句 指 定 需要 查询 的 类 


OQL 查 询 需 要 在 FROM 子 句 定义 的 查询 范围 上 进行 操作 。FROM 
子 句 可 以 接受 的 查询 范围 描述 包括 下 列 几 种 方式 : 


1) 通过 类 名 进行 查询 ， 如 : 


SELECT * FROM java.lang.String 


2) 通过 正则 表达 式 匹 配 一 组 类 名 进行 查询 ， 如 : 


SELECT * FROM"java\.lang\..*" 


3) 通过 类 对 象 在 堆 转 储 快照 中 的 地 址 进行 查询 ， 如 : 


SELECT * FROM Oxe14a100 


4) 通过 对 象 在 堆 转 储 快照 中 的 ID 进 行 查询 ， 如 : 


SELECT * FROM 3022 


5) 在 子 查 询 中 的 结果 集中 进行 查询 ， 如 : 


SELECT * FROM (SELECT * FROM java.lang.Class c WHERE c 
implements org.eclipse.mat.snapshot.model.IClass) 


上 上面 的 查询 返回 堆 转 储 快照 中 所 有 实现 
了 "org.eclipse.mat.snapshot.model.IClass" 接 口 的 类 。 下 面 的 这 人 句 查 询 使 
用 属性 访问 器 达到 了 同样 的 效果 ， 它 直接 调用 了 ISnapshot 对 象 的 方 
| 


SELECT * FROM $snapshot.getClasses() 


使 用 "INSTANCEOF" 关 键 字 把 指定 类 的 子 类 列 入 查询 结果 集 之 
中 ， 如 : 


SELECT * FROM INSTANCEOF java.lang.ref.Reference 


这 个 查询 的 结果 集中 将 会 包含 WeakReference、SoftReference 和 
PhantomReference 类 型 的 对 象 ， 因 为 它们 都 继承 日 
java.lang.ref.Reference。 下 面 这 人 句 查 询 也 有 相同 的 结果 : 


snapshot .getClassesByName 
SELECT * FROM $snapshot.getcl ByN 
("java.1lang.ref.Reference", true) 


.禁止 查询 类 实例 


在 FROM 子 句 中 使 用 "OBJECTS'" 关 键 字 可 以 禁止 OQL 把 查询 的 范 
围 解 释 为 对 象 实例 ， 如 : 


SELECT * FROM OBJECTS java.lang.String 


这 个 查询 的 结果 不 是 返回 快照 中 所 有 的 字符 串 ， 而 是 只 有 一 个 对 
象 ， 也 就 是 java.lang.String 类 对 应 的 Class 对 象 。 


D.3 WHERE 子 铝 


1.>=、<=、>>、<、[NOT]JLIKE，[NOT]IN (关系 操作 ) 


WHERE 子 句 用 于 指定 搜索 的 条 件 ， 即 从 查询 结 采 中 删除 不 需要 
的 数据 ， 如 : 


SELECT * FROM java.lang.String s WHERE $s.count>=100 


SELECT * FROM java.lang.String s WHERE toString (s) LIKE".*day" 
SELECT * FROM java.lang.String s WHERE s.value NOT IN dominators 
(s) 


2.=、!= (等 于 操作 ) 
SELECT * FROM java.lang.String s WHERE toString (s) ="monday" 


3.AND (条 件 “ 与 操作 ) 


SELECT * FROM java.lang.String s WHERE s.count>100 AND 
s.Q@retainedHeapSize>s.@usedHeapSize 


4.0R (条 件 “ 或 "操作 ) 


条 件 “ 或 ”操作 可 以 应 用 于 表达 式 、 篆 量 文 本 和 子 查 询 之 中 ， 如 : 


SELECT * FROM java.lang.String s WHERE s.count>1000 OR 
s.value.@length>1000 


文字 表达 式 包 括 了 布尔 值 、 字 符 串 、 整 型 、 长 整 型 和 null， 如 : 


SELECT * FROM java.lang.String s 
WHERE (s.count>1000) =true 

WHERE toString (s) ="monday" 
WHERE dominators (s) .size()=0 
WHERE s.@retainedHeapSize>1024L 
WHERE Ss.Q@GCROoOtINfo!=null 


D.4 属性 访问 右 
1. 访 问 堆 转 储 快照 中 对 象 的 字段 
对 象 的 内 存 属性 可 以 通过 传统 的 “点 表示 法 ”进行 访问 ， 格 式 为 : 
[<alias>.]<field> .<field>.<field>.... 
2. 访 问 Java Bean 属 性 
格式 为 : 
[<alias>.]@<attribute>... 


使 用 @ 符 号 ，OQL 可 以 访问 底层 Java 对 象 的 内 存 属性 。 下 表 列 出 了 
一 些 音 用 的 Java 属 性。 


目标 接口 属性 含义 

objectId 快照 中 对 象 的 ID 
objectAddress 快照 中 对 象 的 地 址 

任意 堆 中 对 象 Iobject > tS 
usedHeapSize 对 象 的 ShallowSize 

对 象 的 RetainedSize 

displayName 对 象 的 显示 名 称 

类 对 象 Iclass classLoaderld 类 加 载 器 的 ID 


任意 数组 Iarray 数组 的 长 度 


3. 调 用 OQL Java 方 法 


格式 为 : 


[<alias> .]@< 方 法 > ([< 表 达 式 >，< 表 达 式 >]) .…. 


加 “0? 将 会 令 MAT 解 释 为 一 个 OQL Java 方 法 调用 。 这 个 方法 的 调用 
是 通过 反射 执行 的 。 常 见 的 OQL Java 方 法 如 下 : 
目标 接口 含义 


getClasses() 获取 所 有 类 的 集合 


Ssnapshot Isnapshot getClassesByName(String name,boolean 


获取 指定 类 的 集合 


includeSubClasses) 


hasSuperClass() 如 果 对 象 有 父 类 ， 则 返回 true 


Class object 
isArrayType() 如 果 Class 是 数组 类 型 ， 则 返回 true 


4.0QL 的 内 建 画 数 


格式 为 : 


<function> (<parameter>) 


函数 名 称 作用 
toHex( number ) 以 十 六 进 制 的 形式 打印 数字 
toString( object ) 返回 对 象 的 值 ， 即 使 用 一 个 字符 串 表示 对 象 的 内 容 
dominators( object ) 返回 直接 持 有 指定 对 象 的 对 象 列表 
outbounds( object ) 获取 对 象 的 外 部 引用 
inbounds( object ) 获取 对 象 的 内 部 引用 
classof( object ) 获取 对 象 所 属 的 类 型 对 象 


dominatorof( object ) 返回 直接 持 有 当前 对 象 的 对 象 列表 ， 如 果 没 有 则 返回 -1 


D.5 _ OQL 语 言 


目标 


SelectStatement 


SelectList 


Selectltem 


PathExpression 
EnvVarPathExpression 
ObjectFacet 


ParameterList 


FromClause 


Fromltem 


ClassName 


言 的 BNF 范 式 


洲 
D 


方法 

"SELECT" SelectList FromClause ( WhereClause )? ( UnionClause )? 

(( "DISTINCT" | "AS RETAINED SET" )? ("*" | "OBJECTS" SelectItem | 
SelectItem ("," SelectItem )* )) 

( PathExpression | EnvVarPathExpression ) ( "AS" ( <STRING LITERAL> | 
<IDENTIFIER> ) )?</IDENTIFIER></STRING LITERAL> 

( ObjectFacet | BuildInFunction ) ( "." ObjectFacet )* 

("$"<IDENTIFIER> )("." ObjectFacet )* 

(("@")?<IDENTIFIER> ( ParameterList )? ) 

"(" ( (PrimaryExpression ("," PrimaryExpression )* ) )2 ")" 

"FROM" ("OBJECTS" ("INSTANCEOF" (Fromltem | "(" SelectStatement ")" ) 
(<IDENTIFIER> )? 

( ClassName | <STRING LITERAL> | ObjectAddress ( "," ObjectAddress )* | 
Objectld ("," Objectld )* | EnvVarPathExpression ) 

(<IDENTIEFIER> ("." <IDENTIFIER> y* ("[]")*) 


目标 
ObjectAddress 
ObjectId 
WhereClause 
ConditionalOrExpression 
ConditionalAndExpression 


EqualityExpression 


RelationalExpression 


LikeClause 
InClause 


PrimaryExpression 


SubQuery 


Function 


Literal 


BooleanLiteral 


NullLiteral 


UnionClause 


中 口 


<HEX_LITERAL> 

<INTEGER LITERAL> 

"WHERE" ConditionalOrExpression 

Conditional AndExpression ( "or" Conditional AndExpression )* 

EqualityExpression ( "and" EqualityExpression )* 

RelationalExpression ( ( "=" RelationalExpression | "!=" RelationalExpression ) )* 

( PrimaryExpression ( ("<" PrimaryExpression | ">" PrimaryExpression |"<=" 
PrimaryExpression | ">=" PrimaryExpression | ( LikeClause | InClause ) | 
"implements" ClassName ) )? ) 

("NOT")? "LIKE" <STRING LITERAL> 

("NOT" )? "IN" PrimaryExpression 

Literal 

"(" (ConditionalOrExpression | SubQuery ) ") 

PathExpression 

EnvVarPathExpression 

SelectStatement 
时 这 classof" | 


outbounds inbounds 


" | 上 my | " 


( ("toHex" | "toString" | "dominators 
"dominatorof” ) "(" ConditionalOrExpression ")" ) 

(<INTEGER LITERAL> | <LONG LITERAL> | <FLOATING POINT LITERAL> | 
<CHARACTER LITERAL> |<STRING LITERAL> |BooleanLiteral | NullLiteral ) 

"true" 

"false" 

<NULL> 

( "UNION" "(" SelectStatement ")" )+ 


附录 E JDK 历 史 版 本 轨迹 


大 部 分 的 JDK 历 史 版 本 (JDK 1.1.6 之 后 的 版 本 ) ， 以 及 JDK 所 附带 
的 各 种 工具 的 历史 版 本 ， 都 可 以 从 Oracle 公 司 的 网 站 [上 下 载 到 。 


ET: ET 
| 
| 
| 
| 


JDK 1.2 JDK 12.1 1999-03-30 


JDK 1.2.2 1999-07-08 


JDK 1.3.0 (HotSpot 1.3.0-C) Kestrel 2000-05-08 
JDK 1.3.0 Update 2 (HotSpot 1.3.0 02) 
JDK 1.3.0 Update 3 (HotSpot 1.3.0 03 ) 
JDK 1.3.0 Update 4 (HotSpot 1.3.0 04 ) 
JDK 1.3.0 Update 5 (HotSpot 1.3.0_ 05 ) 


JDK 1.3 JDK 1.3.1 (HotSpot 1.3.1) Ladybird 2001-05-17 
JDK 1.3.1 Update 1 (HotSpot 1.3.1 01) 


JDK 1.3.1 Update la (HotSpot 1.3.1 01a) 
JDK 1.3.1 Update 2 (HotSpot 1.3.1 02) 
JDK 1.3.1 Update 3 (HotSpot 1.3.1 03 ) 
JDK 1.3.1 Update 4 (HotSpot 1.3.1 04) 
JDK 1.3.1 Update 5 (HotSpot 1.3.1 05 ) 


( 续 ) 


ER 2 
pe iospo 31 007 | | 
Depa Hospo i 31 07 | | 
一 uses | | 
pe op | | 
pee nosport3 1 | | 
pe opt | | 
paver iospo aon | | 
Dea vpaea hospo 4002 | | 
eon ospo do 0 | | 
pap iospor a0 0 | | 


JDK 1.4.1 (HotSpot 1.4.1) Grasshopper 2002-09-16 
i 
> 

JDK 1.4.1 Update 3 ‘(HotSpot 1.4.1_03) 

一 各 富生 
TT | | 
ep tiospo | 
一 eyes on | | 
ap ospo Aa 0 | | 


JDK 1.4 JDK 1.4.2 Update 2 (HotSpot 1.4.2 02) 


JDK 1.4.2 Update 3 (HotSpot 1.4.2 03) 


pepe ope | | 
pepes hospor 42 05 | | 
[so | | 
i | 


JDK 1.4.2 Update 8 (HotSpot 1.4.2 08-b03 ) 


JDK 1.4.2 Update9 (HotSpot 1.4.2 09-b05) 


JDK 1.4.2 Update 10 (HotSpot 1.4.2 10-b03) 


TT 
JDK 1.4.2 Update 12 (HotSpot 1.4.2 12-b03) 
nn 
pep orspor a2 4005] | | 
[aas | | 
pep to Cespor 42 160 | | 
pep hospor 142 T7000) | | 


TD 
ra usa | | 
Soul dopo ts00 | | 
supa Mop S00 | | 
Soup opor so 00 | | 


JDK 1.6.0 Update 11 


JDK 1.6.0 Update 12 
JDK 1.6.0 Update 13 (‘HotSpot 11.3-b02) 


( 续 ) 


5 ED 
JDK 1.6.0 Update 15 (HotSpot 14.1-b02) | 
JDK 1.6.0 Update 16 (HotSpot 14.2-b01) | | 
ope 7 esp iss00 | 有 
eo i ospor 0b) | | 
pvpome os | 


JDK 1.6.0 Update 20 (HotSpot 16.3-b01) 


JDK 1.6.0 Update 21 (HotSpot 17.0-b17) 2010-07-10 


JDK 1.6.0 Update 22 (HotSpot17.1-b03) | | 2010-10-22 
JDK 1.6.0 Update 23 (HotSpot 19.0-b09) | | 2010-12-08 


JDK 1.6.0 Update 24 2011-02-15 
JDK 1.6.0 Update 25 2011-03-21 
JDK 1.6.0 Update 26 2011-06-07 


JDK 1.6.0 Update 30 2011-12-12 
JDK 1.6.0 Update 31 一 一 一 一 2012-02-14 
JDK 1.6.0 Update 32 | | 2012-04-26 
JDK 1.6.0 Update 34 2012-08-14 


JDK 1.7.0 Dolphin 2011-07-28 
JDK 1.7.0 Update 1 | | 201-10-18 


JDK 1.7.0 Update 2 2011-12-12 
JDK 1.7.0 Update 3 2012-02-14 
JDK 1.7.0 Update 4 2012-04-26 


JDK 1.7 
JDK 1.7.0 Update 5 | | 2012-06-12 
JDK 1.7.0 Update 6 | | 2012-08-14 


JDK 1.7.0 Update 7 2012-08-30 
JDK 1.7.0 Update 9 2012-10-16 


JDK 1.7.0 Update 10 | | 2012-120 


JDK 1.6 


[1] 下 载 页 面 地 址 : http://www.oracle.com/technetwork/java/archive- 
139210.html ° 
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